Posted on Monday July 18th, 2016Sunday July 9th, 2023 by Carl Morris (Blog)Dadansoddi 283 iaith Wicipedia (yn ara deg) This entry is only available in Cymraeg.
Mae modd lawrlwytho’r tablau MySQL penodol ar gyfer pob wiki: https://dumps.wikimedia.org/cywiki/20160701/ Dyma’r tablau berthnasol: https://www.mediawiki.org/wiki/Manual:Langlinks_table https://www.mediawiki.org/wiki/Manual:Page_table Dim angen ‘sgript’, gan fod modd gwneud popeth yn MySQL. Ar gyfer rhestr o bob tudalen unigryw yn y Gymraeg, rywbeth fel: SELECT page_title FROM pages LEFT JOIN langlinks ON (ll_from = page_id) WHERE ll_from IS NULL; Neu: SELECT page_title FROM pages WHERE page_id NOT IN (SELECT UNIQUE ll_from FROM langlinks)
Mae’r sgript wreiddiol wedi gorffen! Cyhoeddaf ganlyniadau yn fuan. O ran y dympiau mae’r rhan fwyaf ohonynt yn anghyflawn ar hyn o bryd. Gawn ni weld pa mor fawr yw’r samplau. https://dumps.wikimedia.org/backup-index.html Ceisiaf gymharu canlyniadau o’r ddau ddull hefyd.
Mae modd lawrlwytho’r tablau MySQL penodol ar gyfer pob wiki:
https://dumps.wikimedia.org/cywiki/20160701/
Dyma’r tablau berthnasol:
https://www.mediawiki.org/wiki/Manual:Langlinks_table
https://www.mediawiki.org/wiki/Manual:Page_table
Dim angen ‘sgript’, gan fod modd gwneud popeth yn MySQL.
Ar gyfer rhestr o bob tudalen unigryw yn y Gymraeg, rywbeth fel:
SELECT page_title FROM pages LEFT JOIN langlinks ON (ll_from = page_id) WHERE ll_from IS NULL;
Neu:
SELECT page_title FROM pages WHERE page_id NOT IN (SELECT UNIQUE ll_from FROM langlinks)
Cymeraf gipolwg Curon – diolch o galon i ti.
Mae’r sgript wreiddiol wedi gorffen! Cyhoeddaf ganlyniadau yn fuan.
O ran y dympiau mae’r rhan fwyaf ohonynt yn anghyflawn ar hyn o bryd. Gawn ni weld pa mor fawr yw’r samplau.
https://dumps.wikimedia.org/backup-index.html
Ceisiaf gymharu canlyniadau o’r ddau ddull hefyd.
Gallaf awgrymy defnyddio AWS i wneud pethau fel hyn. Rho floedd am unrhyw gyngor.