Wicidelta/Wikidelta ar flog swyddogol Wikimedia UK

wicidelta-aromaneg

Dw i wedi dechrau fersiwn Gymraeg o gyfrif Twitter Wicidelta.

Mae gen ti ddewis!

O ran yr enwau yr unig wahaniaeth yw’r ‘c’ neu ‘k’ – Wicidelta neu Wikidelta.

Hefyd mae Wikimedia UK wedi fy ngwahodd i ymhelaethu am Wicidelta ac mae dwy fersiwn o’r blogiad newydd fynd yn fyw:

Diolch i Llywelyn2000 am ein cyflwyno.

Prin yw’r siaradwraig neu siaradwr Cymraeg sydd ddim yn ymddiddori mewn ieithoedd gwahanol dw i’n credu.

DIWEDDARIAD 9 Rhagfyr: newydd ychwanegu rheol sy’n atal erthyglau llai na 1000 nod er mwyn ceisio canfod mwy o’r ‘gorau’ o bob iaith. Fe oedd ‘na ambell i erthygl rhy fach. Gawn ni weld pa gynnwys a ddaw. Fel o’n i’n dweud yn y blogiad mae ‘na rheolau eraill hoffwn i ychwanegu.

Wikidelta: erthyglau Wicipedia unigryw mewn 284 iaith

Mae anturiaethau Wicipedia yn parhau gyda chyfrif arbrofol newydd @Wikidelta.

Dilynwch y cyfrif am ddolenni achlysurol at erthyglau Wicipedia unigryw mewn sawl iaith. Mae ‘unigryw’ yn golygu erthyglau sydd heb gael eu cysylltu/cyfieithu/addasu o/i unrhyw erthygl Wicipedia mewn unrhyw iaith eraill.

Mae’r cyfrif wrthi’n mynd drwy gyfanswm o 284 iaith wahanol! Heddiw roedd e’n rhannu dolenni at erthyglau mewn Gaeleg yr Alban.

Os ydych chi wedi gweld @UnigrywUnigryw mae’n weddol debyg heblaw am y ffaith bod Wikidelta yn dewis iaith wahanol bob hyn a hyn.

Gawn ni weld faint o erthyglau ar Wikidelta sydd wir yn unigryw a faint sydd angen eu cysylltu (er enghraifft roedd rhaid i mi ymweld â Wicipedia er mwyn cysylltu erthygl i ieithoedd eraill heddiw).

Dw i am flogio ar Medium cyn hir er mwyn rhannu’r cyfrif gyda phobl sy’n siarad ieithoedd eraill.

Hefyd hoffwn i ddechrau fersiwn Cymraeg o gyfrif Wikidelta. Mae gwneud popeth yn Gymraeg yn bwysig i mi. Yr unig elfennau sydd yn Saesneg yw enw y cyfrif, bywgraffiad a’r trydariadau am newid iaith. Felly bydd angen rhestr Gymraeg o enwau’r ieithoedd i gyd. Dwedwch os ydych chi am helpu gyda job cyfieithu bach iawn.

Diolch i Ffrancon am gyfrannu at syniad Wikidelta ac i Illtud am yr enw.

Dadansoddi 283 iaith Wicipedia (yn ara deg) – rhan 2

Gorffennais ddadansoddiad o bob un iaith sydd ar gael ar Wicipedia sbel yn ôl, sef cyfanswm o 283 iaith. Darllenwch y cofnod blog diwethaf am ragor o fanylion.

Dw i wedi bod yn hynod frysur yn ddiweddar ac heb gael siawns i dacluso neu ddehongli’r data yn iawn.

Felly gad i mi wybod yn y sylwadau os ydych chi eisiau cael cipolwg ar y canlyniadau.

Y cyd-destun hollbwysig

Dadansoddi 283 iaith Wicipedia (yn ara deg)

Mae cymunedau ieithyddol yn cynnal sawl Wicipedia ac mae pob un yn wahanol. Mae rhywfaint o gyfieithu ac addasu ac mae rhywfaint o erthyglau sy’n unigryw i’r fersiwn Cymraeg, y fersiwn Catalaneg, y fersiwn Arabeg, ac ati.

Dechreuais i’r cyfrif Twitter awtomatig UnigrywUnigryw i rannu’r erthyglau sydd ond ar y Wicipedia Cymraeg.

Pa ganran o erthyglau unigryw sydd ar y Wicipedia Cymraeg?

Beth am BOB iaith Wicipedia?

Fel mae’n digwydd mae hi’n eithaf rhwydd addasu’r sgript feddalwedd PHP wreiddiol i edrych at ieithoedd gwahanol. Dw i wedi ymestyn y sgript tu ôl i @UnigrywUnigryw er mwyn dadansoddi POB iaith ar Wicipedia yn awtomatig.

Mae cyfanswm o 283 iaith o dan fy ystyriaeth. Mae rhai o ieithoedd yna sydd ddim yn gyfarwydd i mi o gwbl tan nawr, e.e. Wicipedia yn yr iaith অসমীয়া.

Allbwn y broses fydd fath o dabl o ieithoedd gwahanol. Ble mae’r Gymraeg ar y siart?! Ydy’r drefn ar y siart yn adlewyrchu’r nifer o erthyglau yn yr ieithoedd? Neu fuddsoddiad yn yr ieithoedd?

Beth am ieithoedd sy’n gysylltiedig drwy nifer helaeth o siaradwyr amlieithog, megis Sbaeneg-Catalaneg, Sbaeneg-Basgeg, Saesneg-Cymraeg, Wrdw-Arabeg, Iseldireg-Almaeneg, ayyb.?

Dw i’n gallu ceisio ymateb i’r cwestiynau uchod cyn hir…

Yr unig broblem gyda’r sgript feddalwedd dw i wedi ysgrifennu yw’r amser mae’n cymryd.

Mae fy sgript yn wneud ceisiadau i API Wicipedia, sydd yn cynnig pecyn o 20 erthygl ar hap i’w dadansoddi ar y tro. Mae angen cael lot fawr o becynnau er mwyn cael data dibynadwy.

Gwnes i ddechrau tua 12:40yp heddiw cyn mynd am dro i dre am ginio a dw i newydd gyfrif faint o ieithoedd mae’r peth wedi dadansoddi ers hynny. Bydd hi’n mynd trwy ieithoedd yn gyflymach yn y pen draw achos fydd ddim angen gymaint o sampl ar gyfer yr ieithoedd bychain bychain.

Ta waeth, ar y gyfradd yma bydd hi’n cymryd rhyw bedwar diwrnod i orffen!

Mae’n rhedeg ar weinydd pell dw i’n talu £5 y mis amdano fe, y math o letya mae rhywun yn rhoi gwefan fach arno fe. Mae’r un weinydd yn rhedeg UnigrywUnigryw felly mae hi’n ddefnydd da o arian.

Efallai dylwn i edrych at redeg algorithm cyfochrog ar rywbeth swish fel AWS.

Fel arall, oes ‘na unrhyw un sydd am fenthyg amser ar uwchgyfrifiadur anferth i mi pls? 🙂

Delweddau: map y byd / Kraftwerk

DIWEDDARIAD 19 Gorffennaf 2016: Mae dwy iaith uwchben y Saesneg ar y siart o ieithoedd ‘mwyaf unigryw’ ar Wicipedia – hyd yn hyn! Mae’r system wrthi’n dadansoddi Hindi.

Ychwanegu ‘rhestr ddu’ i gyfrif @UnigrywUnigryw

Dw i wedi bod yn joio canlyniadau fy mhrosiect arbrofol @UnigrywUnigryw, cyfrif Twitter sy’n postio erthyglau sydd ond ar gael ar y fersiwn Cymraeg o Wicipedia.

Dyma rai o’r trydariadau diddorol hyd yn hyn: Hywel Hughes Bogotá, Toni CarollEilian, Edrych am Jiwlia, Gwawdodyn byr.

Mae’r detholiad yn hollol randym (‘ffug-hap’ yw’r term) – heb unrhyw dueddiadau. Hyd yn hyn…

Yn fy marn i mae ‘na ychydig bach gormod o gyfeiriadau at lyfrau Saesneg.

Felly o’n i’n meddwl y byddai hi’n hwyl a diddorol i hidlo’r canlyniadau gyda ‘rhestr ddu’:

  • Categori:Llyfrau hanes yn y Saesneg
  • Categori:Nofelau Saesneg
  • Categori:Teithlyfrau Saesneg
  • Categori:Atgofion a hunangofiannau Saesneg
  • Categori:Llyfrau hanes yn y Saesneg
  • Categori:Hanes Crefydd yn Saesneg
  • Categori:Bywgraffiadau Saesneg
  • Categori:Llyfrau Saesneg ar hamdden
  • Categori:Nofelau Saesneg i bobl ifanc
  • Categori:Barddoniaeth Gymreig yn yr iaith Saesneg
  • Categori:Llenyddiaeth plant Saesneg
  • Categori:Bywgraffiadau Saesneg
  • Categori:Llyfrau Saesneg

O hyn ymlaen mae’r ap fach sy’n rhedeg yn y cefndir yn osgoi unrhyw erthyglau yn y categoriau uchod yn llwyr.

Mae hi’n digon hawdd ffeindio tudalennau o dan y categoriau yma os ydych chi’n chwilio Wicipedia am enwau’r categoriau. Does dim byd wedi digwydd i’r categoriau na’r tudalennau ar Wicipedia ei hun, a dw i’n falch bod nhw yn bodoli (diolch i Wicibrosiect Llyfrau Gwales).

Ond dw i wedi penderfynu fy mod i eisiau rhoi mwy o bwyslais ar bethau eraill drwy’r cyfrif ar hyn o bryd.

Mae cwmnïau meddalwedd fel Google a Facebook yn gwneud y math yma o newidiad bob dydd yn ôl eu mympwy. I ba raddau? Does neb tu fas i’r cwmnïau yn hollol sicr. Fyddai’r cwmnïau ddim mor agored â fi yn hynny o beth.

Er ei bod hi’n fach iawn dyma achos prin, dw i’n credu, o algorithm hollol awtomatig ar unrhyw gyfrwng cymdeithasol ar y we sy’n ffafrio pethau yn Gymraeg ar draul pethau Saesneg (neu iaith arall)! Hynny yw, mae’r cod yn osgoi pethau Saesneg o dan gategoriau penodol ‘yn fwriadol’. Byddwn i’n croesawu enghreifftiau eraill o hyn yn y sylwadau.

 

@UnigrywUnigryw – erthyglau sydd ond ar Wicipedia Cymraeg

Fel o’n i’n dweud y tro diwethaf dw i wedi bod yn creu rhaglenni bach sy’n postio pethau i Twitter yn awtomatig.

Dyma un newydd sbon: @UnigrywUnigryw

Mae @UnigrywUnigryw yn postio dolenni i erthyglau Wicipedia sydd dim ond ar gael ar y fersiwn Cymraeg o Wicipedia. Hynny yw, mae pob un erthygl yn unigryw i’n fersiwn ni o Wicipedia.

Mae pob trydariad yn syndod i mi achos mae’r system yn postio erthyglau ar hap. Ond dw i wedi cael cipolwg ar y mathau o erthyglau sy’n debygol o ymddangos.

Hyd yn hyn mae lot fawr o bethau daearyddol, pobl hanesyddol (ac enwau cyfarwydd eraill), a llyfrau.

Pam?

Pam ddilyn? Pam dalu sylw? Dyma rhai o’r rhesymau dw i’n gallu dychmygu:

  • Ffordd o ddod o hyd i erthyglau diddorol ar hap
  • Gweld pa fath o erthyglau mae pobl yn creu
  • Nodi beth sy’n unigryw am Wicipedia Cymraeg (ac am y Gymraeg a diwylliannau cyfrwng Cymraeg o bosib?)
  • Ysgogi mwy o weithgaredd ar Wicipedia Cymraeg a sbarduno rhagor o welliannau i dudalennau, a rhagor o dudalennau newydd
  • Cynnig cyfle i bobl gysylltu tudalennau gyda fersiynau ohonyn nhw mewn ieithoedd eraill, os maen nhw yn bodoli (yn yr achos yma mae’r system yn camddeall bod erthyglau yn unigryw oherwydd diffyg cysylltau)
  • Cynnig cyfle i bobl greu cyfieithiadau ar fersiynau eraill o Wicipedia – os maen nhw yn awyddus i wneud hynny, sbo

Yn yr achos olaf os ydych chi’n creu cyfieithiadau ayyb byddech chi’n wneud Wicipedia Cymraeg yn llai unigryw mewn ffordd. Ond mae rhesymau iawn am wneud hynny weithiau! Dw i ddim yn gallu rheoli sut mae pobl yn manteisio ar y gwybodaeth.

Datblygiad

Byddai hi’n neis postio delweddau hefyd. Dydy Wicipedia ddim yn rhannu cardiau Twitter; byddai angen i mi ychwanegu cod i gipio mân-luniau ar gyfer trydariadau hefyd. Dyna un i fy rhestr o nodweddion arfaethedig.

Gallwn i greu cyfrif arall sy’n postio’r dolenni coch er mwyn annog rhagor o fewnbwn a thwf Wicipedia Cymraeg.

I’r rhai sy’n chwilfrydig mae fy ngweinydd yn rhedeg sgript php drwy cron job. Mae’r sgript yn wneud ceisiadau am JSON drwy API Wicipedia ac yn defnyddio codebird-php i drydar.

Gweler archifau’r tag UnigrywUnigryw am ragor o ddiweddariadau.