Wikipedia:Botcafé/Archief/2009-12

Doorverwijspagina's. Hoe verder? bewerken

Dit onderwerp kon misschien beter in het doorverwijscafé, maar ik heb zo'n idee dat dit café vaker wordt gelezen en daarnaast staat de mooie tabel van het aantal doorverwijspagina's hier.

Vandaag hebben we weer eens een nieuw laagterecord gevestigd van de afgelopen twee jaar met het aantal links naar dp's. Een mooi succes. De vraag is hoe nu verder om dit aantal nog verder terug te dringen? Is het bijvoorbeeld wenselijk (en vooral: is het werkbaar) om de grens van de getoonde links naar dp's op de lijst nog verder te verlagen? Op dit moment is die grens dat er tenminste 11 links naar dp's zijn. Hoe lager het aantal, hoe minder werkbaar het wordt, aangezien er dan steeds meer gevallen zoals van Saša Ilić zullen opduiken. Daarnaast zal de lijst waarschijnlijk exponentieel groter worden bij het verlagen van de grens.

Sowieso zou m.i. de botopdracht die Bryanbot uitvoert wellicht wat verfijnd kunnen worden. Een probleem is echter dat Bryan niet meer op Wikipedia actief is, al is hij nog wel per mail bereikbaar. Communicatie op Wikipedia behoeft toch meer mijn voorkeur dan steeds te moeten mailen. De botopdracht zou, indien mogelijk, op de volgende punten verbeterd kunnen worden:

  • Redirects niet meenemend (Zie geval Saša Ilić)

En twijfelgevallen:

  • Links in Sjabloon:Zieook en Sjabloon:Zie niet meenemend
  • Links onder het kopje Zie ook niet meenemend. Onder dit kopje zullen echter ook nog wel foute links staan.

Ik weet dus ook niet of het een en ander mogelijk is, maar ik hoor graag op- en/of aanmerkingen. Pompidom 5 dec 2009 10:41 (CET)[reageer]

Eens met Pompidom lager dan 11 werkt niet. Ik heb deze zomer een aantal keer contact gehad met Bryan, een keer omdat de bot niet meer liep en een aantal keer om de grens terug te brengen, die nu dus op 11 staat. Ik zal hem met een email wijzen op deze discussie, misschien wil hij aanpassingen doen of anders zijn kennis (script) overdragen aan mij of een ander. Japiot 5 dec 2009 11:40 (CET)[reageer]
Ik denk dat Pompidom zie dp of zie artikel als sjabloon omdat dat de enige twee zie-sjablonen die in principe bovenaan een pagina worden gebruikt en kunnen verwijzen naar een dp. Zie ook is eigenlijk niet bedoeld voor bovenaan een artikel is destijds in een peiling vastgesteld. Maar links naar dp's zouden wat mij betreft beter weggehaald kunnen worden en beter vermeden kunnen worden. Alleen met een Amsterdam-constructie lijkt het me zinvol om een link te plaatsen naar de dp, en dat is al jaren het beleid dat ik weet. Er is betreft deze lijst twee opties als ik het zo zie:
  • De lijst inkorten op basis van een minimum aantal links naar een dp. Maar dan heb je het risico dat de lijst vrijwel leeg gaat raken.
  • De lijst zo laten, en dat gebruikers die grotere aantallen graag doen, de grotere aantallen laten doen, en de gebruikers die graag kleinere aantallen willen doen, de kleinere aantallen laten doen. In principe helpen alle beetjes mee.
Ik denk dat een andere aanpak ook wel eens zou kunnen werken aan de hand van Wikicleaner. We kunnen ook een lijst maken met artikelen die de meeste links hebben naar doorverwijspagina's. Met Wikicleaner kunnen dan alle dp-links op een artikel worden gecorrigeerd.
Nog een andere optie lijkt mij dat er een programma geschreven wordt dat net als een spider/bot uit zichzelf op zoek gaat naar dp's waarheen links verwijzen, en dan de gebruiker die links toont en de dp-opties toont (inclusief overslaan-optie). Maar daarvoor moet iemand voor worden aangesproken die dat kan maken, het is in principe simpel te maken. Groetjes - Romaine (overleg) 5 dec 2009 18:20 (CET)[reageer]
Ik stel voor de grens wel te verlagen naar minder dan 11, maar tegelijkertijd een maximum in te voeren voor het aantal pagina's dat hier wordt gelinkt - Quistnix 5 dec 2009 18:28 (CET)[reageer]
Ik vind het een goede suggestie van Romaine om te kijken of het mogelijk is om een lijst te maken met artikelen met het meeste aantal dp's. Zo heb ik in september al eens enkele honderden uit Lijst van ISO 639-3-codes gehaald. Wel een grote klus, maar daardoor neemt het aantal wel weer flink af. Pompidom 5 dec 2009 18:31 (CET)[reageer]
Dat programma bestaat al, de solve_disambiguation.py van Pywikipediabot kan op die manier gebruikt worden door de optie "-start" toe te voegen. Zie ook mijn opmerking hieronder. - André Engels 9 dec 2009 14:11 (CET)[reageer]
Redirects zijn triviaal uit de resultaatset te filteren. Ik kan niet specifiek op links in een bepaalde sjabloon filteren. Het enige wat op dat punt mogelijk is om pagina's uit te sluiten die een specifiek sjabloon bevat. -- Bryan (talk|commons) 5 dec 2009 23:13 (CET)[reageer]
Als redirects eruit gefilterd kunnen worden, dan is dat alweer een mooie verbetering. En een kleine verlaging naar tenminste 10 (of 9) links naar dp's zou op dit moment ook wel kunnen, maar is nog onvoldoende om nog een grote hap van de 70.000 af te krijgen. Pompidom 6 dec 2009 13:08 (CET)[reageer]
Het kan wel eens exponentieel kunnen groeien; terug naar 10 en ik denk dat er zo een paar honderd bijkomen. Japiot 7 dec 2009 23:54 (CET)[reageer]
Redirects eruit halen lijkt me een verbetering. Wat betreft het aantal zou ik zeggen: Maak het variabel zodat je hetzelfde aantal pagina's op de lijst houdt, bijvoorbeeld de eerste 100 of 150 plus alle pagina's die evenveel links hebben als de nummer 100/150. Maar ik zou ook willen wijzen op andere methoden om dp's te vinden. Als je Pywikipediabot gebruikt, probeer dan eens "solve_disambiguation.py -start:<titel> -min:<aantal>", dan ga je door de dp's vanaf <titel>, waarbij echter alleen dp's met minimaal <aantal> links ernaartoe daadwerkelijk worden behandeld. Ikzelf ben inmiddels al van 10 naar 3 omlaag gegaan voor het aantal... - André Engels 8 dec 2009 21:09 (CET)[reageer]
Daarvoor heb je dus wel een pywikipediabot nodig. Op dit moment gebruik ik enkel de AWB. Wat voor mij nu wel even werkt is ook gebruik maken van de lijst op Speciaal:Doorverwijspagina's. Daar worden redirects echter ook gewoon weergegeven. Pompidom 9 dec 2009 14:52 (CET)[reageer]