Wikipedia:Verzoekpagina voor bots

Dit is een oude versie van deze pagina, bewerkt door Dajasj (overleg | bijdragen) op 27 aug 2021 om 11:23. (→‎Is dit een goed idee...?: uitleg over welke bewerking)
Deze versie kan sterk verschillen van de huidige versie van deze pagina.
Nieuwe verzoeken graag in de eerste sectie toevoegen: afgehandelde verzoeken graag verplaatsen naar onderen.
Zie WP:VPB
Op deze pagina kunnen de gebruikers verzoeken plaatsen aan eigenaren van bots. Bijvoorbeeld om een bepaalde categorie van een heleboel pagina's te verwijderen.

Gelieve uw verzoek te ondertekenen met vier tildes: ~~~~.

Een verzoek toevoegen...

Verzoeken voor een botbitje kunnen worden geplaatst op Wikipedia:Aanmelding botgebruikers.

Meldingen van grootschalige botimport van nieuwe artikelen kunnen op Wikipedia:Meldingen botimport nieuwe artikelen geplaatst worden.

Afgehandelde verzoeken mogen na verloop van tijd worden verplaatst naar het archief.

Overzicht beheerpagina's

Verzoeken

Nieuwe verzoeken

Bronvermeldingen uit artikelgeschiedenis halen

Hallo allemaal,

Nav de huidige bronnendiscussie in de Kroeg: zou het mogelijk zijn om bronvermeldingen die de afgelopen 20 jaar middels bewerkingssamenvatting bij artikelen zijn gedaan (vrij standaard gebruik tot een jaar of 6 geleden: "vertaald van", "bron:..") op te lepelen en op de overlegpagina's van de artikelen te zetten, zodat we ze na kunnen kijken en kunnen zien of we ze in een {{references}} onderaan het artikel kunnen verwerken?

Vanuit de samenwerking voor de kwaliteitsschaal voor artikelen weet ik dat je geautomatiseerd een databasedump kunt doorzoeken (eventueel kan ik die verstrekken denk ik) op de bewerkingssamenvatting die bij een bewerking is gedaan. Vinden we dat interessant, en zou iemand het leuk vinden om hier eens in te duiken? Of misschien kunnen we het meenemen als taak die wij als gemeenschap zouden waarderen naar de aankomende hackathon tijdens Wikimania in augustus? Dit soort taken zijn volgens mij wel interessant voor mensen die hun bot-beheersing willen oefenen? Ciell need me? ping me! 17 jun 2021 19:48 (CEST)[reageer]

Is dat dan een andere dump dan die genoemd staan op Wikipedia:AutoWikiBrowser#Wiki Data Dump Searcher? Die dumps bevatten namelijk alleen de laatste versies van de artikelen, zonder de geschiedenis. Of ik moet iets missen ... Wikiwerner (overleg) 19 jun 2021 16:27 (CEST)[reageer]
Op deze pagina vind je niet alleen bestanden met de (toen) actuele versie van het artikel, maar ook bestanden waarin 'All pages with complete page edit history' beschikbaar zijn, in .7z- en in .bz2-formaat. Er zijn (voorbeelden van) scripts om deze bestanden te doorlopen. Met wat aanpassingen zijn hierin ongetwijfeld ook de bewerkingssamenvattingen te lezen, zijn hieruit de regels te halen waarin iets als 'http://' of 'https://' staat en zijn die gegevens ook bijeen te brengen. Het is een kleine moeite om daarbij ook een verwijzing op te nemen naar de specifieke bewerking, zodat makkelijk te zien is wat er met die bws ondersteund is. Eventueel kan nog in beeld gebracht worden wie de bewerking deed en of deze met de eerstvolgende bewerking ongedaan is gemaakt.
Dat zal dan resulteren in iets als (op de overlegpagina van Kabinetsformatie Nederland 2021):
In de bewerkingssamenvattingen aangetroffen bronnen:
Bedenk wel dat het over 2 miljoen artikelen gaat. Stel dat bij 1% een of meer bronnen worden aangetroffen in de bewerkingssamenvattingen, dan zijn dat 20.000 bewerkingen op overlegpagina's. Met 10 bewerkingen per minuut is dat anderhalve dag aan bewerkingen, met wellicht nog wat meer tijd omdat het lezen van de paginageschiedenis wat tijd kan kosten. Maar ik schat in dat de tijd meer opgaat aan het wachten tussen opeenvolgende bewerkingen dan aan het daadwerkelijke zoekwerk.
Met vriendelijke groet, RonnieV (overleg) 19 jun 2021 17:38 (CEST)[reageer]
Dank voor de toelichting Ronnie. Ik snap dat het veel werk zou gaan zijn: ik zou ook nog eens voor willen stellen om als die overlegpagina's in een onderhoudscategorie te plaatsen zodat we ze na kunnen lopen. Ik denk wel dat we hiermee misschien toch een flink aantal artikelen ineens van een bron kunnen gaan voorzien, iets waar we nu in dit soort discussies als die in de Kroeg wel vaak tegenaan lopen. Want dat zou betekenen dat duizenden artikelen ineens hun (misschien wel eerste!) bron krijgt. Dat is toch super in anderhalve dag? Oke, misschien willen we de bot alleen 's nachts laten lopen, maar dan nog, in een week...! Ciell need me? ping me! 19 jun 2021 22:58 (CEST)[reageer]
Even los van het botgebeuren: qua dumps zou de "stub-meta-history" (ca. 4GB) de relevante informatie moeten bezitten (zie https://dumps.wikimedia.org/nlwiki/20210620/). Ik zal vanavond even kijken of ik op tool labs een ruwe schatting kan maken van hoeveel revisies er met commentaar 'bron' + een url zijn. Een snelle database-check (https://quarry.wmflabs.org/query/56133) suggereert dat er ongeveer 13000 revisies met het woord 'bron' zijn. Dat is inclusief revisies met commentaar als 'bron ontbreekt', dus dat valt alleszins mee (of tegen, als het doel is om snel veel bronvermeldingen toe te voegen ;-)) valhallasw (overleg) 20 jun 2021 19:04 (CEST)[reageer]
Mooi begin denk ik! Ik weet dat ik niet altijd een link plaatste, maar bijvoorbeeld ook een artikel startte met bv "vertaald van en", en volgens mij was ik daar niet de enige in. Dan zou in theorie nagenoeg altijd de revision-id die op dat moment het meest recent was op de Engelstalige Wikipedia de bron zijn geweest, een enkele keer misschien een versie ervoor. Oa Clara (neushoorn) (start vertaling van de:) en Douwe Mout van der Meer (Start vertaling duits artikel) heb ik destijds zo "bebrond", ik vermoed nadat ik dit door anderen zo had zien doen. Ciell need me? ping me! 20 jun 2021 19:44 (CEST)[reageer]
Een eerste voorzetje om mee te spelen: https://valhallasw-testing-tool.toolforge.org/nlwiki_broncomment/
Dit zijn bewerkingscommentaren met 'bron' (bron.out), 'vertaald' of 'vertaling' (vertaald.out) en vervolgens gefilterd op 'http' of 'www' (de _met_url varianten) danwel op '[[XX:' (de _wikilink varianten). Het gaat ca. 15000 entries met 'bron' (12000 met url, 2500 met wikilink), ca. 1750 met 'vertaald' of 'vertaling' (1250 met url en 450 met wikilink). De link met de daadwerkelijke revisie is hier kwijt (het was een snelle test ;-)) maar het lijkt kwalitatief redelijk bruikbaar. Ik denk dat er wel een menselijke check overheen moet aangezien het geregeld ook links zijn die er juist niet inmoeten (bv: "revert: letterlijke vertaling http://www.dominican.edu/athletics/recsports/activities/leisure/croquet.html").
Merk op dat er in de grote 'vertaald.out' dataset ook een groot aantal beschrijvingen als 'vertaald uit engelse wp' zijn. Maargoed, ook als die niet worden meegenomen zijn de extra wél gevonden links nuttig. valhallasw (overleg) 20 jun 2021 20:48 (CEST)[reageer]
Volgende stapje: Gebruiker:Valhallasw/bronlinks. valhallasw (overleg) 22 jun 2021 22:14 (CEST)[reageer]

Inmiddels ben ik hier weer wat verder mee gekomen: wat extra filters om botbewerkingen uit te filteren helpt een hoop voor de signaal-ruisverhouding. @Ciell:, zou je een kijkje kunnen nemen op Gebruiker:Valhallasw/bronlinks om te kijken of dit inderdaad is wat je zoekt? (ik snap dat je het later nog graag op de overlegpagina's uitgesplitst ziet ;-)). valhallasw (overleg) 24 jul 2021 22:17 (CEST)[reageer]

@Valhallasw Dit is inderdaad precies wat ik bedoel! Die melding kan dan op de overlegpagina geplaatst worden, met als verzoek om te controleren of de informatie nog in het artikel aanwezig is en zoja, de referentie op de correcte manier in te voegen, plus eventueel een {{appendix}}. Na controle en verwerking kan de pagina voorgedragen worden voor nuweg, of de opmerking weer van de pagina verwijderd. Alle overlegpagina's samen in een onderhoudscategorie lijkt me behulpzaam om zicht te houden op wat er nog ligt. Eigenlijk volgens mij dus een procedure gelijk aan 'onbereikbare bron' en in het verleden de 'afbeeldingssuggestie'.
Dank Valhallasw, voor het uitwerken van dit idee! Ciell need me? ping me! 30 jul 2021 16:49 (CEST)[reageer]
Top! Zou jij na kunnen denken over een sjabloon wat ik daar voor kan gebruiken (met wat uitleg, de onderhoudscat, etc... kan als echt sjabloon of gewoon als stukje wikitext dat ik aan elkaar kan plakken)? Dan kan ik vervolgens zorgen dat het op de diverse pagina's terecht komt. valhallasw (overleg) 3 aug 2021 18:54 (CEST)[reageer]
Hi @Valhallasw, is dit een goed voorstel? Laat maar weten als ik ergens nog niet aan dacht, en ik help je uiteraard graag met het schrijven van een FAQ. Ciell need me? ping me! 5 aug 2021 15:32 (CEST)[reageer]
Even geprobeerd, dat ziet er volgens mij prima uit:Gebruiker:Valhallasw/bronlinks/Sjabloon#Voorbeeldtekst voor op overleg 2. Ik ga even puzzelen wat ookalweer de handigste manier is om een paar duizend pagina's een sectie toe te voegen!
Pagina's negeren: Pywikibot zal {{nobots}} netjes volgen, maar verder dan dat is het denk ik niet de moeite; het is immers een eenmalige botrun. Als het gaat om herhaalde checks dan moeten we denk ik meer richting een web-systeem kijken waar edits echt 'afgevinkt' kunnen worden (anders is het onderscheid tussen 'nieuw' en 'al gecheckt maar niet relevant' lastig te maken). Maar dan wordt het wel meteen een stuk complexer... valhallasw (overleg) 11 aug 2021 20:09 (CEST)[reageer]
Aantal testbewerkingen: Speciaal:Bijdragen/Valhallasw-toolserver-botje valhallasw (overleg) 11 aug 2021 21:00 (CEST)[reageer]
Lijkt me goed @Valhallasw:! Ik heb een start gemaakt met een kleine FAQ: Gebruiker:Valhallasw/bronlinks/faq. Ciell need me? ping me! 27 aug 2021 09:35 (CEST)[reageer]

Is dit een goed idee...?

Weghalen lijkt mij geen goed idee. Kopiëren kan wel. En wat mij betreft worden de huidige vertaalsjabloons in een bws nu al in de hoofdnaamruimte geplaatst. Er gaat namelijk (vrijwel) niemand de moeite doen om vertaalsjabloons handmatig te verhuizen. Het controleren of een van de versies van een lemma een vertaling is, neemt veel te veel werk in beslag. En het zou ook een goed idee zijn te verplichten om bij het aanmaken van een lemma "vertaalsjabloons" meteen in de hoofdnaamruimte te plaatsen. Net schiet mij een recente discussie te binnen. Ik vroeg aan een Wikipediaan of hij van één lemma voor de duidelijkheid aan de lezer het vertaalsjabloon uit de bws in de hoofdnaamruimte wilde zetten. Dat leverde meteen kritiek op van een andere gebruiker die schreef dat het plaatsen in de hoofdnaamruimte niet verplicht was en daarom onnodig. Uiteindelijk is het ook niet gebeurd. Om dit soort discussies te vermijden, zou je eerst verplicht moeten stellen om ze in een hoofdnaamruimte weer te geven, want anders blijven gebruikers de vertaalsjablonen in de bws zetten en blijf je bezig met overplaatsen naar een OP, controle etc. HT (overleg) 12 aug 2021 07:40 (CEST)[reageer]
ter info: Vertaalsjablonen komen automatisch in de BWS bij gebruik van de vertaaltool. En dat is volkomen logisch, want daar staan alle bijdragers en via dat sjabloon kan je de bijdragers vinden in de andere taal. De andere taalversie is dus geen bron, maar de vertaling is voortborduren op CCBYSA. Om mij onnavolgbare reden willen we hier een extra sjabloon dat dus onnodig is imho. Elly (overleg) 12 aug 2021 09:27 (CEST)[reageer]
Ik kan deze discussie niet helemaal plaatsen. Het botverzoek gaat over een lijst met mogelijke bronnen op een overlegpagina, niet over het automatisch plaatsen van vertaalsjablonen op een artikelpagina. Is dit een vervolg op een discussie die op een andere pagina gevoerd is? valhallasw (overleg) 12 aug 2021 16:39 (CEST)[reageer]
@Valhallasw: Ik las hierboven: "vertaald van", "bron:.." en concludeerde dat het om een vertaling van een lemma ging. Blijkbaar niet. Ik begrijp verder niet het nut van een weergave zoals Dajasj die op 19 juni 2021 09:51 hierboven aangeeft. OP's zijn bedoeld voor overleg tussen gebruikers. Ze lijken mij niet bedoeld om te verduidelijken dat in een bws een bron vermeld wordt. HT (overleg) 13 aug 2021 19:07 (CEST)[reageer]
Ik zie geen bijdrage in dit overleg van Dajasj HT? Inderdaad is het wel mijn idee om de bronvermedling anderstalige Wikipedia in te voegen, en je hebt gelijk dat dit niet verplicht is, maar bronvermelding in de geschiedenis is eigenlijk heel erg verborgen, dus ik zie dit meer als een service naar enerzijds de lezer, en anderzijds ook als een duidelijkere manier om tegemoet te komen aan de voorwaarden van de CC BY-SA. Ciell need me? ping me! 27 aug 2021 09:39 (CEST)[reageer]
Verwezen wordt naar deze bewerking die RonnieV hierboven als voorbeeld gebruikt. Even ter context, ik zette de referentie bij hoge uitzondering in de bewerkingssamenvatting omdat het alleen ging om het bijwerken van de tijdlijn, wat na paar dagen alweer verouderd is. Toevoegen op andere plek lijkt me in dit geval in ieder geval niet nodig. Dajasj (overleg) 27 aug 2021 11:23 (CEST)[reageer]

Internetarchive

Hoi,

Met het vertalen zie ik dat op de Engelstalige Wikipedia bij alle links naar bronnen automatisch (?) een link naar een gearchiveerde pagina in de internetarchive wordt gegeven. Toen ik gisteren de bronnen bij het artikel over Prinses Maxima bekeek, zag ik dat in ieder geval de bronnen van de NOS in het artikel dode links zijn, en ik kon de bronnen (artikelen uit 2001, 2007) zelf ook niet meer terugvinden op de nieuwssite. Kunnen wij dit misschien ook botmatig oppakken?
Ik stel me dan voor: een botje dat controleert op het sjabloon {{bron}}, die ervoor zorgt dat als er sprake is van een online bron:

  • dat de bron op de nieuwssite wordt gearchiveerd in archive.org
  • de gearchiveerde link verborgen wordt toegevoegd aan de bronvermelding in het artikel.

Zou zoiets mogelijk zijn? Ciell need me? ping me! 18 nov 2020 15:33 (CET)[reageer]

Even een ping voor @Smile4ever.   Akoopal overleg. 18 nov 2020 20:59 (CET)[reageer]
Hallo. Momenteel is het reeds mogelijk om gearchiveerde versies van pagina's toe te voegen als verborgen link. Hiervoor dien je op de cite-sjablonen de parameter dodeurl=nee in te vullen. Je krijgt dan beschikking over de parameters archiefurl en archiefdatum. Wanneer een bron dood wordt, is het dan voldoende om dodeurl=ja te gebruiken ipv dodeurl=nee. Met vriendelijke groeten,  4ever(Overleg) 19 nov 2020 11:15 (CET)[reageer]
Hi @Smile4ever, het gaat om het archiveren van webpagina's die wij gebruiken als referentie in het internetarchief, niet eens zozeer de link hier maken. (Wel handig, maar niet essentieel). Zie ook hier: het blijft een wens en blijkbaar niet alleen van mij. Ik was helemaal vergeten dat ik dit verzoek 4 maand geleden al eens hier had gedaan! Ciell need me? ping me! 1 mrt 2021 20:26 (CET)[reageer]
Iets anders gesteld (en wellicht duidelijker): het is de bedoeling om onze referenties/bronnen aan web.archive.org toe te voegen. Als dat is gelukt, kan de archief-url en datum natuurlijk gelijk in het sjabloon worden ingevuld met dode-url=nee. Op die manier zorgen we ervoor dat onze bronnen (wat volgens de veel gebruikers het belangrijkste van een artikel is) bewaard blijft, waarmee ook WP:VER goed ondersteund wordt. Nu komen we er vaak te laat achter dat er geen archief gemaakt is. Edoderoo (overleg) 2 mrt 2021 08:16 (CET)[reageer]
Je kan deze links zelf actief archiveren. Een bot doet dit niet momenteel. Met vriendelijke groeten,  4ever(Overleg) 2 mrt 2021 17:10 (CET)[reageer]
Ik weet dat ik dat zelf kan, maar ik verzoek dus om een bot die dat doet. Voor 90% (natte vinger) van onze schrijvers is het al een toer om een bron of referentie in te vullen, laat staan dat ze die ook nog zelf invoeren bij archive.org. Ciell need me? ping me! 2 mrt 2021 17:24 (CET)[reageer]
Vanuit de Koninklijke Bibliotheek zijn OlafJanssen en ik samen met 1Veertje (KB) aan het onderzoeken hoe we precies deze (getrapte) vraag kunnen uitvoeren voor linken naar de KB-website; hoe kunnen we een bot 1) de linken op nl:wiki naar de kb-website archiveren in het internet archive en 2) hoe kunnen we de archieflink laten vermelden bij een link naar de KB-website (en 3. hoe kunnen heel regelmatig bekijken welke linken 'dood zijn' en daar de archieflink prominent maken.) Groet, DanielleJWiki (overleg) 3 mrt 2021 09:59 (CET)[reageer]
Ik neem aan dat jullie de API-uitleg dan al gezien hebben? Edoderoo (overleg) 3 mrt 2021 10:54 (CET)[reageer]
Hoogstwaarschijnlijk is het - omdat het voor ons op dit moment alleen om de linken naar de kb-website gaat - een logischere aanpak om eerst te zorgen dat die webpagina's standaard gearchiveerd worden in het internetarchief en vervolgens op nl:wiki de linken naar de website aan te vullen met de archieflink. DanielleJWiki (overleg) 4 mrt 2021 09:53 (CET)[reageer]
Ook dan is een python-scriptje (of PHP of iets anders dat de API aanroept) heel handig, want het invoeren/controleren/terughalen van die URLs kun je middels die API geheel geautomatiseerd uitvoeren. Edoderoo (overleg) 4 mrt 2021 09:58 (CET)[reageer]
@Smile4ever De vraag is dus ook of een bot het zou kunnen doen. Dus voor nieuwe referenties checken of hij in het internetarchive staat en zo niet een save aan te vragen, en mogelijk dan in tweede instantie de parameters aan een cite-sjabloon toe te voegen.   Akoopal overleg. 3 mrt 2021 15:09 (CET)[reageer]
Die tweede instantie dient (liefst vooraf) gecontroleerd te worden. Een archiveeractie levert lang niet altijd een bruikbare pagina op. –bdijkstra (overleg) 3 mrt 2021 15:22 (CET)[reageer]
Wellicht niet 100% on-topic hier, maar hier zag ik een interessante opmerking. –bdijkstra (overleg) 2 mrt 2021 11:15 (CET)[reageer]
Dan misschien eerst daar polsen of ze het wel OK vinden dat wij zo massaal archiveringen gaan aanvragen? Wikiwerner (overleg) 1 mei 2021 14:19 (CEST)[reageer]
Archive.is is niet gelijk aan archive.org, wat volgens mij het webarchief is die wij momenteel het meest gebruiken. Het blog van internetarchive.org is deze. Desalniettemin is vragen wel zo netjes, maar laten we vooral een onderzoeken hoe we het archiveren van onze bronnen technisch mogelijk zouden kunnen maken? Ciell need me? ping me! 30 jul 2021 16:55 (CEST)[reageer]

Nav een vraag in de Kroeg

Misschien begrijp ik het verkeerd, maar is dit niet precies wat InternetArchiveBot kan en doet? Enige verschil is dat je handmatig een pagina moet selecteren om daar de bewerking op te laten doen. Bij wijze van test heb ik het even geprobeerd. Daarboven op heeft het ook een ratelimit, dus je kan niet even alle twee miljoen pagina's in een dag doen. Maar als mensen af en toe hun pagina's hier doorheen halen, zijn we al aardig ver. Helpt dit? Dajasj (overleg) 5 aug 2021 17:06 (CEST)[reageer]
Hey @Ciell:. Ik ben nog beetje aan het rondkijken, maar we kunnen wellicht een bot maken die de API van InternetArchiveBot aanroept. Specifiek dan analyzepage, die voegt dus ook archief links van live urls toe. Dat scheelt het wiel opnieuw uitvinden. Maar goed, ik zal nog even verder onderzoeken wat de mogelijkheden zijn. Dajasj (overleg) 5 aug 2021 18:48 (CEST)[reageer]
Even voor de meelezers: het lijkt erop, maar voor deze bot moet je als gebruiker zelf actief een verzoek bij de bot doen, een pagina per keer, waarna deze het hele proces in werking zet. Dat is inderdaad al wat!, maar niet wat ik hier bedoel. Het gaat me juist om een bot die (eens per dag, eens per 5 dagen, zeg het maar) onze encyclopedie crawlt op zoek naar nieuwe externe links die nog niet opgeslagen zijn in het Internet Archive. Ciell need me? ping me! 5 aug 2021 19:54 (CEST)[reageer]
Ik bedoelde ook niet met het tweede dat IAB de volledige oplossing is, maar door IAB aan te roepen via de API, hoeven we eigenlijk alleen een botje te schrijven dat die pagina's opspoort en doorgeeft aan IAB. Mijn ervaring met botjes is zeer beperkt, maar dat lijkt me een aanzienlijke versimpeling van wat een nieuw botje moet doen. Maar goed, ik ga me hier verder in verdiepen. Dajasj (overleg) 5 aug 2021 21:21 (CEST)[reageer]
Het stappenplan voor de bot moet dus worden als volgt:
Corrigeer me als ik iets mis. Uiteraard kunnen we niet botmatig controleren of de archiefversie goed bruikbaar is, zoals bdijkstra vraagt. Aan de andere kant: hoe erg is dat? De archiefversie staat dan immers zojuist op Archive.org, en de Archivebot zal hem dan toevoegen zodra de originele URL dood wordt. Wikiwerner (overleg) 7 aug 2021 17:55 (CEST)[reageer]
Even geprobeerd met de hand, en dan krijg je zoiets. De archieflink kan bijv. ook aan het eind van de ref-tag, dus vlak voor </ref>. Wikiwerner (overleg) 7 aug 2021 18:07 (CEST)[reageer]
Controleren of een pagina reeds gearchiveerd is, kan via het trucje "2005": https://web.archive.org/web/2005/http://users.pandora.be/brail/lijn/lijn3666.htm redirect niet naar een specifieke pagina, terwijl https://web.archive.org/web/2005/http://users.pandora.be/brail/lijn/lijn36.htm -> https://web.archive.org/web/20050320062031/http://users.pandora.be/brail/lijn/lijn36.htm dat wel doet. Verder eens: als InternetArchiveBot dit via de analyzepage optie al kan, dan moeten we het wiel niet opnieuw uitvinden. Met vriendelijke groeten,  4ever(Overleg) 7 aug 2021 18:13 (CEST)[reageer]
Uiteraard, maar volgens mij missen we dan nog steeds het punt van Ciell: het archiveren van nog actieve URL's die voorkomen in artikelen en waarvan er nog geen archiefversie is. Zoals ik het lees, voegt de analyzepage-optie alleen archieflinks toe van URL's waarvan er al wel een archiefversie is. Wikiwerner (overleg) 14 aug 2021 19:17 (CEST)[reageer]

Eerste versie

Hoi allemaal, ik heb een eerste versie gemaakt. Uitvoerig testen is nog nodig, maar wilde het alvast melden zodat feedback gegeven kan worden. De code staat op Gebruiker:DajasjBot/archivelinks.py. In principe staat de volledige werkende code er, maar op twee plaatsen heb ik iets toegevoegd en verwijderd zodat het voorlopig alleen werkt op mijn kladblok (zodat ik niet per ongeluk over heel Wikipedia heen ga). Kijk dus ook vooral in de bewerkingsgeschiedenis van Gebruiker:DajasjBot/Kladblok.
Het gaat in eerste instantie over de datadump en zoekt naar pagina's met citeersjabloon waar geen archieflink staat. Vervolgens controleert het of dit ook klopt op de live versie. Daarna controleert het of een gearchiveerde versie al bestaat (dit lijkt altijd het geval, een andere bot - waarschijnlijk IAB - doet dit automatisch). Als het wel al bestaat, zoekt het dichtstbijzijnde versie, anders maakt ie een nieuwe aan. Vervolgens wordt het oude citeersjabloon vervangen door het nieuwe, met zo weinig mogelijk wijzigingen verder in de opmaak.
Alle feedback is welkom! Ook kritiek en bezwaren ;) Dajasj (overleg) 26 aug 2021 10:49 (CEST)[reageer]
Ik begin ook Python te ontdekken sinds april, en heb dus weer wat geleerd! Wat mij opvalt is de code voor de snelheidslimiet van 1 bewerking per minuut. Ik regel dit in user-config.py, met de parameter put_throttle. Of heb je een andere reden om dit zo te doen? Reguliere expressies gebruik ik al langer in AWB. Die voor de citeeraanroep kan misschien ruimer met zoiets als \{\{\s*[Cc]ite(er)? [a-z]([^}]|\{\{[^}]*\}\})*\}\}, zodat het script ook werkt op citeeraanroepen die sjablonen bevatten; ik heb dit nog niet getest. Als nieuweling had ik al wel gelezen dat het sneller is om een reguliere expressie te compileren met re.compile(patroon, opties) als je er vaker mee zoekt. En waar haal je de packages bz2file en lxml vandaan? Ze zien er elegant uit. Wikiwerner (overleg) 26 aug 2021 19:41 (CEST)[reageer]
Dank voor het meekijken! Ik had de parameter put_throttle nog niet bestudeerd (eerste week met pywikibot ;)). Ik had wel door dat het zelf pauzeerde, maar dacht, wat extra netheid kan geen kwaad ;) Goede tip voor uitbreiding van de reguliere expressie, ik had nog niet aan Engels sjabloon gedacht, maar zal dat bestuderen. Je hebt ook gelijk over het compilen. Ik vond dit echter nu even makkelijker, maar dat moet ik wel doen ja. Al is die snelheidswinst waarschijnlijk verwaarloosbaar tov de rest. De packages bz2file en lxml kende ik uit het verleden. bz2file is handig om niet het bestand te hoeven "unzippen", lxml om door het xml bestand heen te gaan.
Ik ben nu vooral op zoek naar manieren waarop het fout kan gaan. Dus mocht je suggesties hebben voor dingen om te testen, laat het me weten. Tot nu toe doet het alles goed. Dajasj (overleg) 26 aug 2021 20:09 (CEST)[reageer]

Links naar HTTP sites, vervangen voor HTTPS bij gelijke content

Op Wikipedia wordt nog naar een hoop http-sites gelinkt. Om gebruikers van meer privacy te voorzien is het goed om deze links aan te passen naar https, maar natuurlijk alleen als dezelfde content wordt aangeboden over deze verbinding. I-am-will (overleg) 5 jan 2020 19:07 (CET)[reageer]

Ik ben Python nog aan het ontdekken, maar ik zag dit over het openen van websites, incl. de foutcodes zoals 404. Is het veilig genoeg om te controleren of de https-variant een 404 oplevert, en zoniet de https-variant op te nemen? Wikiwerner (overleg) 1 mei 2021 14:19 (CEST)[reageer]
Zorg wel dat je een HEAD-request doet i.p.v. GET. En er zijn meer foutcodes dan 404; sowieso alleen een link opnemen wanneer die 2xx of 3xx oplevert. Ik weet niet of urllib2 het volgen van redirects kan onderdrukken, want als je http wil omzetten in https moet je eigenlijk ook controleren of een eventuele ketting van redirects telkens https blijft gebruiken. –bdijkstra (overleg) 3 mei 2021 11:29 (CEST)[reageer]
Bedankt. Meteen even verder gezocht: lijkt wel te kunnen. Wikiwerner (overleg) 3 mei 2021 22:01 (CEST)[reageer]
Ik heb wat verder gespeeld met de Requests head() Method. "ad = requests.head('http://www.ad.nl')" levert responscode 301. "ad.next.url" levert vervolgens https://www.ad.nl. "ads = requests.head('https://www.ad.nl')" levert echter responscode 403; ik denk vanwege de cookiewall. Is er een manier om daarmee om te gaan? Wikiwerner (overleg) 7 aug 2021 21:12 (CEST)[reageer]
Met curl -I https://www.ad.nl/ krijg ik een 302 naar myprivacy.dpgmedia.nl, de cookiewall. Misschien doe je iets fout, of anders wellicht een beperking van urllib2. –bdijkstra (overleg) 7 aug 2021 21:27 (CEST)[reageer]
O, ik had daar redirects toegestaan. Zonder redirects krijg ik inderdaad een 302 naar de cookiewall. Maar vervolgens levert "requests.head(ads.next.url)" een 403 op. Overigens zitten de commando's in de requests-package. De Urllib2-package kan inderdaad geen redirects onderdrukken, voor zover ik zie. Wikiwerner (overleg) 7 aug 2021 22:00 (CEST)[reageer]
Wanneer de site enkel html gebruikt, kun je met python een eind komen. Maar zodra er java-script op de pagina zit, dan moet je rare trucken uithalen, die mij nog nooit gelukt zijn. Je moet dan via de geinstalleerde browser (FireFox, Chrome, etc) de java-script om laten zetten naar de uiteindelijke html, zonder dat krijg je enkel een regeltje dat de javascript zou aanroepen. Edoderoo (overleg) 7 aug 2021 22:52 (CEST)[reageer]
Een eerste batch zou denk ik prima kunnen worden verbeterd middel een eenvoudig script: als de site waar naar gelinkt wordt zelf al en 30x doet naar dezelfde url op https, dan weet je dat je die link veilig van http naar https kunt zetten.
Een tweede batch zou je dezelfde pagina op zowel http als https kunnen ophalen en simpelweg een simpele compare kunnen doen (99% match is het dezelfde pagina vaak wel), mits het certificaat geldig is.
Alle uitzonderingen die je dan nog overhoud, die worden spannender en zal een geavanceerder botje nodig hebben ;).
Wellicht zijn er in andere wikipedia-landen al bots gemaakt waar een en ander afgekeken kan worden? I-am-will (overleg) 9 aug 2021 12:42 (CEST)[reageer]
Klinkt simpel, maar wat doen we dan met de vraag van bdijkstra? Is het genoeg als de lezer eindigt op een https-site? Met de tussenliggende http-redirects wisselt de lezer immers geen gegevens uit. Wikiwerner (overleg) 10 aug 2021 19:17 (CEST)[reageer]
Stap 1 is denk ik het vinden en omzetten van http-links die een werkende redirect zijn naar een https-link met hetzelfde pad. –bdijkstra (overleg) 10 aug 2021 20:23 (CEST)[reageer]

Bevolkingsaantallen botmatig aangemaakte gemeenten

Bij buitenlandse dorpen kan het zijn dat een bevolkingsaantal uit 2002 wordt vermeld, dat inmiddels xx% afwijkt van de werkelijkheid. Is dat erg? Zo ja, is het ook mogelijk dat dit botmatig wordt aangepast, gebruik makend van de betreffende taalversie die vrij actueel is? Ik heb geen zicht op de technische mogelijkheden.Koos van den beukel (overleg) 10 jan 2019 12:04 (CET)[reageer]

Weet ik ook niet; misschien dat je het in het Botcafé kunt vragen? Encycloon (overleg) 26 jan 2019 17:12 (CET)[reageer]
Ja, dat is in principe een vrij simpel script. Heb je een voorbeeldcategorie? Geef dan gerust een roep op mijn overlegpagina, of doe een verzoek op WP:VPB. Edoderoo (overleg) 26 jan 2019 18:43 (CET)[reageer]
Een voorbeeld is [2] waarbij onze cijfers uit 2002 dateren en die in de Sloveense versie uit 2018. Kleine verschillen maken me niet uit, maar ik denk dat het goed is op dit gebied 1x per 15-20 jaar onderhoud te plegen, zeker als dat niet moeilijk is. Dobrovo had in 2002 bijvoorbeeld 413 inwoners, nu 336, dat wijkt duidelijk af. Mogelijk zijn inmiddels gemeenten opgeheven of samengevoegd. Koos van den beukel (overleg) 27 jan 2019 14:46 (CET)[reageer]

PS De uitvoering doe ik liever niet zelf.

Dan zou je zo een wijziging krijgen, maar dan automagisch. Edoderoo (overleg) 27 jan 2019 17:01 (CET)[reageer]
Dat is inderdaad de bedoeling. Koos van den beukel (overleg) 29 jan 2019 10:59 (CET)[reageer]
Ik ben bezig iets te bakken dat WikiData bijwerkt, en dan ook nl-wiki kan bijwerken. Het zijn best veel Sloveense gehuchten, dus dat met de hand doen is niet zinvol. Edoderoo (overleg) 29 jan 2019 12:28 (CET)[reageer]
Hoe staat het er voor, Edo? --Frank Geerlings (overleg) 15 sep 2019 00:30 (CEST)[reageer]
Edo geeft aan dat als iemand anders hiermee aan de slag wil hij zich niet gepasseerd voelt. --Frank Geerlings (overleg) 16 sep 2019 16:28 (CEST)[reageer]
Kan het niet op een soortgelijke manier als bij Nederlandse gemeenten, met zoiets als het sjabloon:Statistiek gemeente Nederland inwoners? Wikiwerner (overleg) 4 jan 2020 22:42 (CET)[reageer]

Slovenië

Dit overleg werd geplaatst onder de kop "Plaatsen in Slovenië die deel uitmaken van een Sloveense gemeente", wat echter een geheel ander onderwerp is, daarom heb ik het verplaatst. Apdency (overleg) 23 okt 2020 21:18 (CEST)[reageer]

Zie overigens ook het verzoek Bevolkingsaantallen botmatig aangemaakte gemeenten. Misschien kunnen we deze twee verzoeken combineren? Edoderoo was bezig met een script voor dat verzoek; hoe staat het daarmee? Wikiwerner (overleg) 4 okt 2020 15:31 (CEST)[reageer]
Combineren is niet per se zinvol, want de sjablonen staan heel ergens anders dan de artikelen. Ik was destijds vastgelopen in een eigenaardige bug in PAWS, en had het de laatste tijd relatief druk met zaken buiten Wikipedia, dus dat moet ik binnenkort weer eens oppakken, om die sjablonen te kunnen vullen. Edoderoo (overleg) 4 okt 2020 17:07 (CEST)[reageer]
Maar de aantallen moeten dan toch weg uit de infoboxen in de artikelen, zodat de infobox ze uit Wikidata haalt? Wikiwerner (overleg) 10 okt 2020 13:30 (CEST)[reageer]
Dat zou eventueel ook kunnen, mijn script zou nu die sjablonen bijwerken, maar een alternatief is een Module in Lua schrijven die de aantallen van een gemeentecode ophaalt, samen met de peildatum. Ik zou dat zien als stap 2, maar als er iemand is die dat kan (of een TechStorm/Hackaton weet waar ze dit voor ons kunnen fabrieken), zou dat mooi meegenomen zijn. Edoderoo (overleg) 10 okt 2020 13:38 (CEST)[reageer]
Zo te zien hebben zelfs de Slovenen dat niet. Misschien kunnen we samenwerken, zodat zij ook makkelijker hun inwonertallen kunnen bijwerken? Wikiwerner (overleg) 17 okt 2020 21:52 (CEST)[reageer]
Ik zie nu dat de Slovenen hun data botmatig bijwerken. Zij zijn inmiddels bij 2020. Ook zag ik Havest Templates op de Wikidata-gebruikerspagina van Edoderoo. Kunnen we daarmee Wikidata bijwerken? En vervolgens onze handmatige inwonertallen weghalen, zodat deze geïmporteerd kunnen worden van Wikidata? Wikiwerner (overleg) 14 feb 2021 21:17 (CET)[reageer]
Voor de reizigersaantallen van de Belgische stations is dit inmiddels geregeld. De aantallen worden uit een CSV-bestand gelezen, en toegevoegd aan het betreffende Wikidata-item. Daarna roept het {{tl:Infobox spoorwegstation België}}-sjabloon een Lua-module aan die deze gegevens ophaalt (de meest recente gegevens) en zorgt dat deze getoond worden, compleet met de bijbehorende bron. Als er een bestand is met deze gegevens voor de Sloveense gemeenten, dan kan dat opgepakt worden. Wel moeten deze echt aan iets unieks herkenbaar zijn. Ik wil ook best het daarvoor geldende stappenplan beschrijven tijdens de uitvoering. Met vriendelijke groet, RonnieV (overleg) 1 mrt 2021 19:35 (CET)[reageer]
Misschien hebben de Slovenen wel zo'n csv-bestand. Of kunnen we anders Harvest Templates gebruiken? Wikiwerner (overleg) 1 mrt 2021 21:48 (CET)[reageer]
Het Sloveense statistiek-bureau heeft die gegevens vast wel, maar als je pech hebt moet je Sloveens spreken om dat terug te vinden. Edoderoo (overleg) 1 mrt 2021 21:59 (CET)[reageer]
Nee hoor: gewoon in het Engels. We kunnen zo'n beetje elk bestandstype kiezen dat we willen. RonnieV, kun je daarmee uit de voeten? Wikiwerner (overleg) 17 apr 2021 16:39 (CEST)[reageer]
Hoi Wikiwerner, ja dat kan ik. Ik was er eerder al eens naar aan het kijken, maar ben er gisteravond maar eens voor gaan zitten om de match te kunnen maken. De gemeentenaam is niet altijd onderscheidend genoeg. Vanmorgen heb ik de meest recente gegevens naar Wikidata gebracht, en voor een gemeente ook oudere. Ik ben nu in de Sloveense Kroeg aan het vragen of ik goed met de data om ga, daarna maak ik een LUA-scriptje (of kijk of er al eentje is) of de gegevens netjes beschikbaar te stellen voor de infobox en de tekst. Met vriendelijke groet, RonnieV (overleg) 19 apr 2021 12:51 (CEST)[reageer]
Goed bezig! Stapje voor stapje komen we er wel ... Wikiwerner (overleg) 19 apr 2021 21:10 (CEST)[reageer]
Het blijkt nog iets makkelijker te kunnen, namelijk met gebruik van Module:Wd. Zie Gebruiker:RonnieV/Slovenië voor enkele voorbeelden van gebruik van de gegevens. Zo kunnen we direct de data (aantal, peildatum en bron) naar een infobox brengen, en in een ander sjabloon een zin maken voor het inwonertal van een plaats, die altijd compleet met datum en bron komt. Met vriendelijke groet, RonnieV (overleg) 23 apr 2021 00:49 (CEST)[reageer]
Wederom mooi! Verder spelen met de moduleaanroep levert voor de infobox het volgende:
inwoners = {{#invoke:wd|property|qualifier|references|Q394087|P1082}}: 4.952[1]
census = {{#invoke:wd|property|qualifier|Q394087|P1082|P585|format=%q}}: 1 juli 2020.
Voor gebruik op andere artikelen moeten we "Q394087" nog vervangen door {{#invoke:wd|label|raw}}. Een alternatief is dat we een eigen {{Infobox plaats in Slovenië}} aanmaken; dit is nu een doorverwijzing naar {{Infobox plaats in land}}. De eerste kan dan de laatste aanroepen met de inwoners en de census ingevuld met de moduleaanroepen. Ook moeten de artikelen een {{Appendix}} of {{References}} krijgen, indien nog niet aanwezig. In de lopende tekst worden veel verschillende formuleringen gebruikt, dus daar is handwerk nodig naast het invoegen van een van de muduleaanroepen. Dan lijkt mij het logischer om de infoboxaanroep ook handmatig aan te passen. Bij de plaatsen is de formulering vaak wel identiek, maar dan hebben we andere gegevens nodig van het statistiekbureau. Wikiwerner (overleg) 27 apr 2021 19:05 (CEST)[reageer]
Gevonden. Wikiwerner (overleg) 2 mei 2021 19:34 (CEST)[reageer]
Dank je, die link had ik al gekregen van onze Sloveense collega's. De import naar Wikidata loopt nu, met bewerkingen als deze. Nog een 5500 plaatsen, dan zijn de aantallen voor de gemeenten (al gedaan) en voor de plaatsen bijgewerkt. Daarna kunnen we ze hier, en op alle andere Wikipedia's gebruiken. De infobox voor Sloveense plaatsen {{Infobox plaats in Slovenië}} zal ik daarna aanpassen, zodat al onze artikelen het meest recente aantal kunnen tonen. Het volstaat om het Q-nummer weg te laten, bijvoorbeeld in het sjabloon, omdat dan de informatie uit het gekoppelde Wikidata-item gebruikt wordt.
Ik zou zeggen: op naar het volgende land, met natuurlijk een oogje op SiStat en het vrijkomen van nieuwe informatie. Met vriendelijke groet, RonnieV (overleg) 3 mei 2021 17:51 (CEST)[reageer]
Wederom goed bezig! Geef maar een seintje als je zover bent. Dan kunnen we daarna zoiets doen voor de lopende tekst, en daarmee tevens de handmatige inwonertallen en jaartallen weghalen. Dat moet me wel lukken met AutoWikiBrowser. Wikiwerner (overleg) 6 mei 2021 20:52 (CEST)[reageer]
Hoi Wikiwerner, bedankt voor je enthousiasme. De infobox is aangemaakt, en ik ben zo vrij geweest om het sjabloon {{Inwonertal}} aan te maken. Dit biedt de mogelijkheid om verschillende waarden op te roepen, in verschillende verschijningsvormen. Voor gebruik op de meeste plaatspagina's werkt {{Inwonertal|soort=zin}}, voor gemeentepagina's {{Inwonertal|soort=zin|locatie=gemeente}}. Voor jouw voorgestelde bewerking kan het dus naar deze vorm, voor de totale wijziging is deze wijziging gewenst. Wil je echt een vrije formulering, dan zijn de verschillende onderdelen beschikbaar vanuit dit sjabloon. Als we er dan ook nog op letten dat er een Appendix/References-blok aanwezig is, dan wordt het wat mij betreft helemaal mooi! Als jij zin hebt om met AWB aan de slag te gaan, leef je uit! Daar ben ik dan weer wat minder ervaren in. Met vriendelijke groet, RonnieV (overleg) 7 mei 2021 01:48 (CEST)[reageer]
Tja, ieder zijn meug. Het leuke van Wikipedia is dan dat we er samen wel uit komen. Ik heb alvast het sjabloon gecategoriseerd in de categorie:Wikipedia:Sjablonen indeling land. In het weekend zal ik kijken hoever ik kom. Wikiwerner (overleg) 7 mei 2021 21:51 (CEST)[reageer]
Ik zie nu dat de oppervlakte niet meer wordt opgegeven als parameter, maar ook uit Wikidata komt. Zal ik daarom alles van de vorm "| oppervlakte =" ook weghalen? Wikiwerner (overleg) 14 mei 2021 21:16 (CEST)[reageer]
Hoi Wikiwerner, als je dat wil meenemen, graag! Wel zo mooi als dat ook uit Wikidata komt en de bevolkingsdichtheid (dus) ook ter plekke berekend wordt aan de hand van de nieuwste cijfers. Met vriendelijke groet, RonnieV (overleg) 18 mei 2021 00:20 (CEST)[reageer]
  Mee bezig Bot loopt. Wikiwerner (overleg) 24 mei 2021 17:22 (CEST)[reageer]
Top, ik zag al wat resultaten! Ziet er goed uit! Betekent dat we dit verzoek kunnen afsluiten, nog mooi binnen de tweeënhalf jaar ;)
Zijn er nog meer landen waarvoor we op een vergelijkbare wijze informatie beschikbaar hebben en we het meest recente inwonertal willen laten zien? Ik zal Sijtze Reurich eens vragen of dit bijvoorbeeld iets is voor Letland of andere landen waar hij veel mee bezig is. Als er maar betrouwbare bronnen zijn, die we kunnen gebruiken. Voor (onder meer) Nederland, Frankrijk en Duitsland gebruiken we nu arrays, die kunnen op dezelfde wijze vervangen worden. Met vriendelijke groet, RonnieV (overleg) 25 mei 2021 13:37 (CEST)[reageer]

Estland

Van Letland weet ik het niet, maar bij Estland besteed ik nadat het Estische Bureau voor de Statistiek nieuwe cijfers heeft gepubliceerd altijd een paar dagen aan het invoeren van die cijfers op alle artikelen over Estische plaatsen. Wikidata houdt die cijfers ook bij en beschikt een paar dagen na de publicatie ook al over de meest actuele cijfers. Ik heb de gegevens van Wikidata meermalen gecontroleerd, maar het klopt altijd. Dan ligt het voor de hand om Wikidata ook de inwonertallen van Estische plaatsen en gemeenten te laten bijhouden. Het aanpassen van de sjablonen "Infobox plaats in Estland" en "Infobox gemeente Estland" gaat mijn technische vaardigheden helaas te boven, maar naar mijn idee is het wel te doen. Dan kan ik die paar dagen besteden aan andere dingen die ook nuttig zijn. Sijtze Reurich (overleg) 27 mei 2021 23:20 (CEST)[reageer]
Excuses voor de verschrijving in je naam, Sijtze Reurich. Bedankt voor je snelle en duidelijke, maar ook instemmende reactie. Voor de gemeenten kan het voor de infobox snel geregeld worden, met dien verstande dat we nog even terugvallen op de cijfers van 2019. Bij de laatste update is de voorkeurswaarde niet ingesteld op de nieuwste waarde, maar dat kan geregeld worden. Ik zie trouwens dat de cijfers van 2021 beschikbaar zijn, dus even kijken of we dit meteen mee kunnen nemen...
De plaatsen is iets lastiger, omdat deze gebruik maken van de standaard infobox voor plaatsen (zij het onder de naam '...in Estland'). Het is echter niet moeilijk om een kopietje te maken van het sjabloon en daarin deze zaken te regelen. Als Wikiwerner daarna nog eens zijn botje wil laten lopen over deze pagina's om daar de tekst aan te passen en de parameters uit de infoboxen te halen, zou dat helemaal top zijn. Met vriendelijke groet, RonnieV (overleg) 28 mei 2021 00:22 (CEST)[reageer]
Misschien is het toch verstandig om nog even wat opmerkingen te maken:
  1. De database van het Estische Bureau voor de Statistiek heeft misschien nog meer ingangen, maar ik gebruik de interactieve kaart op https://estat.stat.ee/StatistikaKaart/VKR. Als een plaatsje minder dan 4 inwoners heeft, geeft die database dat aan als --4. Daarmee wordt dus bedoeld: < 4. Dat mag wat mij betreft best als < 4 in de infobox.
  2. We hebben een paar artikelen over plaatsen in Estland die niet meer bestaan. Een voorbeeld is Pärsikivi. Die plaatsen kunnen beter niet meegenomen worden als Wikidata de inwonertallen gaat aanpassen. Anders krijg je misschien allerlei foutmeldingen. Doorgaans is bij die plaatsen het inwonertal op de datum van opheffing vermeld; dat kan gewoon zo blijven. Er is trouwens een speciale categorie voor: "Voormalige plaats in Estland".
  3. Het is misschien de moeite waard om eens te kijken hoe de Franstalige Wikipedia het doet. Die geeft in de infobox het inwonertal van 2019 en ik vermoed dat het wordt geleverd door Wikidata. Als je kijkt bij w:fr:Kadrina (Pala) zie je iets dat komisch aandoet: in de tekst wordt nog steeds uitgegaan van de situatie in 2011, toen Kadrina in de gemeente Pala lag en 52 inwoners had. Pala is in 2017 opgegaan in de gemeente Peipsiääre. Dat zie je in de infobox, die de situatie anno 2019 beschrijft: een dorpje in de gemeente Peipsiääre met 45 inwoners. Sijtze Reurich (overleg) 28 mei 2021 13:18 (CEST)[reageer]
Het klopt wat je zegt over de Franse wiki. Vergelijkbaar bij ons is de eigen {{Infobox plaats in Slovenië}}, die RonnieV gemaakt heeft (dit was een doorverwijzing naar de {{Infobox plaats in land}}). Voor de lopende tekst heeft RonnieV het sjabloon:Inwonertal gemaakt, zodat tekst en infobox gelijke cijfers geven. Kijk maar eens hoe het nu gaat bij de Sloveense plaatsen. Voor het invoegen was wel een botrun nodig mijnerzijds. Dit wil ik met liefde doen voor meer landen. Een knelpunt wordt dan nog wel de waarden "< 4": we zouden het sjabloon:Inwonertal kunnen aanpassen zodat er dan "minder dan 4 inwoners" in de lopende tekst komt te staan. Wikiwerner (overleg) 28 mei 2021 20:57 (CEST)[reageer]
Staat er bij dergelijke plaatsjes nu ook in. Zie bijvoorbeeld Väikeheinamaa. Sijtze Reurich (overleg) 28 mei 2021 23:51 (CEST)[reageer]
Natuurlijk is het prima om een aantal opmerkingen te maken, zeker als je -zoals jij- al uitgebreid inhoudelijk naar de materie gekeken hebt.
  1. Ik probeer altijd aan gegevens in een tabelvorm te komen, omdat ik die makkelijker (met een bot) kan verwerken. Zo kan ik vanaf [3] de inwonertallen van de settlements binnenhalen. Dat kan voor alle 246 onderscheiden eenheden in een keer binnengehaald worden, en betreft desgewenst de cijfers 2015 tot en met 2021 (per 1 januari). Maar ben ik er met ongeveer 180 'places of residence', of heb ik nu de verkeerde pagina te pakken? Ik kan 'Väikeheinamaa' hier in ieder geval niet vinden.
  2. Wikidata staat niet toe om iets anders in te voeren dan een heel getal voor Property:P1082. Met iets als dit kunnen we aangeven dat 4 het maximum is. Dat houdt de systematiek universeel, ook als het Estse statistiekbureau besluit dat ze aantallen onder de 10 niet langer precies doorgeven, of als de Zuid-Soedanese collega's het houden op '<20'. {{tl|Inwonertal} kan aangepast worden, zodat de kwalificatie 'maximum' wordt opgepikt en het inwonertal dan wordt aangegeven als '<..'. Moeten we er bij de verwerking wel aan denken dat '--4' omgezet moet worden in de waarde '3' met deze kwalificatie.
  3. De oplossing voor het probleem met leeggelopen plaatsen ligt een beetje aan wat wij willen en aan wat het landelijke statistiekbureau doet. Een gemeente die niet meer bestaat (herindeling) zal niet opeens een 0 als inwonertal krijgen, maar normaliter niet meer meegegeven worden in de cijfers. Dan is er niets aan de hand, wordt er geen nieuw aantal gevonden en toegevoegd en zal de markering van voorkeursrang ook bij de oudste wel bekende waarde moeten blijven staan. Deze waarde wordt dan gevonden en getoond, met de datum van toen. Een plaats die formeel nog wel bestaat, maar geen inwoners meer heeft, zal waarschijnlijk met een 0-waarde worden opgenomen. Dat is dan ook het correcte aantal inwoners voor de betreffende datum. Een plaats die niet meer onderscheiden wordt, zal gewoonlijk niet meer in de statistieken worden meegenomen. Is er geen inwonertal bekend voor (zeg) 1-1-2021, dan wordt er niets toegevoegd en zal het inwonertal van 1-1-2020 als meest recente getoond worden. Dat blijft ook zo als de aantallen van 2022-2030 niet worden toegevoegd. Komt er alsnog een inwonertal per 2031, dan wordt dat het meest recente.
  4. Ik ben al even aan het stoeien geweest met een automatisch gegenereerd grafiekje met het verloop van het inwonertal. Dat is in deze gevallen juist goed, want de 0-lijn wordt daadwerkelijk bereikt. Ik heb geprobeerd om de minimale waarde aan te passen, zodat er wel enige wijzigen zichtbaar is bij een plaats waar het inwonertal varieert tussen (zeg) 4500 en 4700. Dan wil je eigenlijk niet een grafiekje met een heel stuk lege ruimte (y-as van 0 tot 5000 of zo), maar liever een y-as tussen 4400 en 4800. Al kan het zijn dat een enkele snelle kijker dan weer denkt dat de verschillen gigantisch zijn... Vooralsnog bied ik deze niet aan om te gebruiken.
  5. Zoals Wikiwerner al schreef, ben ik aan de slag gegaan om het getoonde inwonertal in de tekst ook meteen aan te kunnen passen. Deze wijziging heeft dat voor Võru geregeld, waarbij ik de bestaande tekstconstructie heb gehandhaafd.
Als je nog meer opmerkingen, suggesties,... hebt, ik sta altijd open voor positieve input. Met vriendelijke groet, RonnieV (overleg) 29 mei 2021 01:48 (CEST)[reageer]
Ik heb een paar resultaten bekeken. Het ziet er doorgaans goed uit. Alleen bij Kohtla-Järve zag ik dat in de infobox nu wordt teruggegrepen op de cijfers van 2016. In Wikidata zitten in elk geval ook de cijfers van 2017 t/m 2020. Sijtze Reurich (overleg) 29 mei 2021 08:37 (CEST)[reageer]
Kohtla-Järve is aangepast en daarna bijgewerkt voor 2021 voor Wikidata. In het artikel heb ik het zo opgelost. Met vriendelijke groet, RonnieV (overleg) 29 mei 2021 11:46 (CEST)[reageer]
Dank je, zo is het goed. O ja, die database die jij noemt onder punt 1 ken ik ook en heb ik ook een paar keer gebruikt. Die gaat niet dieper dan het niveau van gemeente, en dan eventueel binnen de gemeente de aantallen inwoners van het stedelijk en het landelijk gebied. Dus spannende plaatsen als Väikeheinamaa, Kaukvere en Palli (Hiiumaa) zul je hier niet vinden. Dan weer wel de aantallen inwoners van de stadsdistricten van Tallinn en Kohtla-Järve. (Dat zijn er bij elkaar trouwens 13, dus lijkt het me niet echt nodig om bij het onderhoud een bot in te schakelen.) Sijtze Reurich (overleg) 29 mei 2021 12:42 (CEST)[reageer]

Frankrijk

Voor Frankrijk zijn er arrays, maar bij heel veel gemeenten komen er nog handmatige getallen voor. Zie ook Wikipedia:De Nulmeridiaan/Archief/2019-1#Inwonertallen in infobox bewerken. –bdijkstra (overleg) 25 mei 2021 13:58 (CEST)[reageer]

Ik zie dat Albertvillanovadelmoral met AVMBot de Franse bevolkingscijfers allemaal redelijk up to date heeft gebracht. Dat zou betekenen dat we dit eenvoudig ook kunnen overnemen. Met oppervlakte en berekende bevolkingsdichtheid. Even goed onderzoeken? Met vriendelijke groet, RonnieV (overleg) 25 mei 2021 19:57 (CEST)[reageer]
Hierover loopt sinds maart overleg op Overleg sjabloon:Grafiek inwonertal gemeente Frankrijk#Stappenplan. Als Wikidata aangevuld is, dan kunnen we ook Frankrijk botmatig langslopen. Wikiwerner (overleg) 19 jun 2021 22:22 (CEST)[reageer]

Niet-uitgevoerde verzoeken

Het/De Landkreis

Graag het lidwoord 'het' veranderen in 'de', bij gebruik van het zelfstandig naamwoord 'Landkreis'. Gielie1994 (overleg) 20 jun 2020 18:02 (CEST)[reageer]

Volgens welke taalautoriteit is "het" fout? –bdijkstra (overleg) 20 aug 2020 18:24 (CEST)[reageer]
Zou Het Landkreis Göttingen is het zuidelijkste landkreis van de deelstaat Nedersaksen. Het huidige Göttingen... dan ook 'De huidige Göttingen...' moeten worden? Nog afgezien van de terechte vraag van bdijkstra is dit geen wijziging die eenvoudig met een bot gedaan kan worden, dit zal, als het al nodig is, handwerk moeten zijn. Met vriendelijke groet, RonnieV (overleg) 20 aug 2020 18:41 (CEST)[reageer]

BotMultichill

In de loop der jaren heb ik meer dan 200.000 bewerkingen gedaan in Commons. Maar dat breekt me nu op, omdat deze bot een - op zich nuttige - aanpassing doet per bestand. De datum wordt verwerkt. Maar het betekent wel dat ik nu soms meer dan 400 of 500 mails per dag krijg van aangepaste bestanden. De bijbehorende vraag is hoe ik bewerkingen van deze bot kan laten stoppen met het verzenden van mails. Pffff. Stunteltje (overleg) 15 sep 2020 11:40 (CEST)[reageer]

SchlurcherBot kan er ook wat van. Ik zou verwachten dat de mails stoppen als je de gebruikersnaam invult bij "Genegeerde gebruikers" op c:Special:Preferences#mw-prefsection-echo. –bdijkstra (overleg) 15 sep 2020 11:44 (CEST)[reageer]
Ik heb nu drie bots afgemeld voor emails in mijn Voorkeuren, maar nog steeds komen de meldingen in bulk binnen. Ik doe iets niet goed , vermoed ik, maar wat? Stunteltje (overleg) 20 sep 2020 15:22 (CEST)[reageer]
Wat hebt jij aangevinkt in jouw voorkeuren? Misschien moet je de opties "Mij e-mailen bij bewerkingen van pagina’s of bestanden op mijn volglijst" en "Mij e-mailen bij kleine bewerkingen van pagina’s en bestanden op mijn volglijst" even uitvinken. The Banner Overleg 20 sep 2020 16:42 (CEST)[reageer]
Beide zijn aangevinkt. Ik wil wel zien dat er geknutseld is aan artikelen waar ik iets aan gedaan heb. Stunteltje (overleg) 20 sep 2020 19:29 (CEST)[reageer]
Misschien helpt het als je botbewerkingen verbergt op je volglijst?Wikiwerner (overleg) 20 sep 2020 19:41 (CEST)[reageer]
Ik heb in de volglijst bij "Filters" nu ook "Bot" aangevinkt. Maar zie geen "opslaan" knop. Stunteltje (overleg) 20 sep 2020 19:52 (CEST)[reageer]
Zie het tabblad Volglijst in je Voorkeuren: "Botbewerkingen op mijn volglijst verbergen". Wikiwerner (overleg) 20 sep 2020 20:37 (CEST)[reageer]
Ook dat gedaan, maar de bots blijven mails sturen. Stunteltje (overleg) 21 sep 2020 00:24 (CEST)[reageer]
Maar heb je nu al die voorkeuren uitgevinkt op Commons en hier? Op de pagina Voorkeuren/Gebruikersprofiel staan er onderaan twee. Maar ook op Voorkeuren/Meldingen staan e-mail opties. The Banner Overleg 21 sep 2020 00:51 (CEST)[reageer]
Ik heb in Wikipedia op Voorkeuren/Meldingen nu ook koppeling met Wikidata uitgezet en onder "Genegeerde gebruikers BotMultichillT toegevoegd. Als ik BotMultichill of SchlurcherBot toevoeg kan ik niet opslaan. In Commons heb ik nu Botbewerkingen op mijn volglijst verbergen aangevinkt, In Koppeling met Wikidata geen vinkje staan en geen meldingengebruikers van BotMultichillT, BotMultichill en SchlurcherBot genoteerd. Nu weer even afwachten wat er gebeurt. Stunteltje (overleg) 21 sep 2020 08:56 (CEST)[reageer]
651 mails vanmorgen. Dit was hem dus ook niet. Stunteltje (overleg) 23 sep 2020 22:56 (CEST)[reageer]

Links aanpassen na het verplaatsen van een artikel

Achtergrond

Nadat de titel van een artikel wordt aangepast (dmv een verplaatsing) moeten de doorverwijzingen naar de oude pagina ook aangepast worden zodat deze verwijzen naar de nieuwe titel. Als de oude titel wordt omgezet naar een doorverwijspagina, komen deze linkjes op deze pagina. Dit is in principe te overzien met doorgaans bewerkingen tussen de 10 en 100. Echter gebeurt er, naar mijn inzicht, niet iets vergelijkbaars met de incorrecte linkjes als de oude titel gebruikt wordt voor een nieuw artikel. Verder is dit iets dat dagelijks gedaan moet worden, waardoor het toch neerkomt op een aardige hoeveelheid werk.

Voorstel

De robot zou volgens de volgende stappen kunnen werken:

  1. Bepaal met het verplaatsingslogboek wat de nieuwe en de oude titel is.
  2. Wacht indien een aanpassing recent gedaan is (zodat deze eventueel teruggedraaid kan worden).
  3. Controleer of de verplaatsing niet weer is teruggedraaid.
  4. Vind de dv's die verwijzen naar de oude titel.
  5. Pas de dv's aan zodat deze verwijzen naar de nieuwe titel.
Cases

Bij het aanpassen van de titel kan de output steeds hetzelfde format hebben, echter zijn er een aantal mogelijkheden voor de input. In verband met de haken heb ik het maar even als volgt genoteerd.

Case 1:

Input: "[ [" + "oude titel" + "] ]"
Output: "[ [" + "nieuwe titel" + "|" + "oude titel" + "] ]"

Een andere optie is om de nieuwe titel aan te passen zodat bijvoorbeeld "Straat (Stad)" veranderd naar "Straat" voor de naam in de lopende tekst.

Case 2:

Input: "[ [" + "oude titel" + "|" + "naam in de lopende tekst" + "] ]"
Output: "[ [" + "nieuwe titel" + "|" + "naam in de lopende tekst" + "] ]"

Groeten, Mikalagrand (overleg) 7 sep 2020 13:55 (CEST)[reageer]

Dag Mikalagrand, bij 'dubbele doorverwijzingen' gebeurt dat al. Of bedoel je ook redirects in artikelen zelf? Repareren daarvan is meestal niet heel noodzakelijk. Encycloon (overleg) 7 sep 2020 14:13 (CEST)[reageer]
Beste Encycloon, wel handig dat er een bot is voor dubbele doorverwijzingen, maar ik bedoelde eigenlijk als er bijvoorbeeld een pagina is over Kees en dan wordt deze verplaatst naar Kees (beroep) zodat de pagina Kees een lemma kan worden over de naam "Kees". Bij nader inzien gebeurd dit misschien toch niet zo vaak. Mikalagrand (overleg) 7 sep 2020 14:25 (CEST)[reageer]
Het gaat specifiek om het omzetten van een artikel in een doorverwijspagina. Dat heeft weinig tot niets met hernoemen te maken, en kan ook niet zodanig geautomatiseerd worden. Het beste is, om voor het aanmaken van de dp, de artikelen naar de nieuwe doelpagina te laten hernoemen met een verzoek op deze pagina. Als het om een paar pagina's gaat, kun je dat ook goed met de hand doen, als je handig bent met AWB kun je dat ook gewoon zelf doen. Edoderoo (overleg) 7 sep 2020 14:24 (CEST)[reageer]
Gelijk ook even mijn stokpaardje van stal halen. Om dit consequent op te lossen, zou de wikisoftware niet naar een titel moeten linken, maar naar een lemma. Titels wijzigen (continu), een artikel is (als het goed is) een constante. Maar dit kan niet op nl-wiki worden opgelost. Edoderoo (overleg) 7 sep 2020 14:27 (CEST)[reageer]
Als ik je goed begrijp is het dus niet mogelijk, omdat de link tussen de nieuwe titel en het werkelijke lemma onbetrouwbaar is. Bij het veranderen van de titel wordt dit wel meteen aangepast op wikidata. Die is dan dus wel gekoppeld aan het lemma, ipv via de titel, of wordt dit automatisch aangepast bij het wijzigen van de titel? Mikalagrand (overleg) 7 sep 2020 15:31 (CEST)[reageer]
Het ligt technisch ingewikkeld, is niet altijd gewenst om uit te voeren, verandert mogelijk enorm veel artikelen. Het kan nu niet, en dat moeten we soms ook niet willen. Wanneer we het wel willen, zou de gebruiker hier een verzoek moeten plaatsen, in de meeste gevallen is dat binnen een dag uitgevoerd. Edoderoo (overleg) 7 sep 2020 16:02 (CEST)[reageer]
Handmatige controle blijft sowieso nodig, ook bij gebruik van AWB. Het gebeurt regelmatig dat sommige inkomende links juist geen betrekking hebben op het verplaatste artikel maar op het nieuwe onderwerp. Wikiwerner (overleg) 7 sep 2020 18:25 (CEST)[reageer]
Dat geldt vooral als de dp al een tijdje bestaat. Als de dp nog niet bestaat kan dat in theorie ook, maar dan was de link al fout. Dat gebeurt ook heel vaak, en een flink aantal links zijn dus momenteel fout terwijl we ze eigenlijk niet terug kunnen vinden. Vorige week nog van een nieuw artikel de binnenkomende links nagelopen, en er waren er 9 goed en 1 fout. Lees mijn stokpaardje dus vooral nog een keer hierboven. Edoderoo (overleg) 7 sep 2020 18:31 (CEST)[reageer]
  Niet uitgevoerd dus. Wikiwerner (overleg) 20 sep 2020 14:09 (CEST)[reageer]

Te beoordelen-sjabloon plaatsen

Na mijn nominatie op de te beoordelen-pagina, moet er nog bij elke pagina een sjabloon geplaatst worden. Zou dit botmatig geplaatst kunnen worden aangezien het over 187 artikels gaat. Het sjabloon is het wegsjabloon met de datum van vandaag. Alvast bedankt. JP001 (Overleg)   14 sep 2020 09:56 (CEST)[reageer]

Dat moet dan zeker wel met een gebruiker ZONDER bot-bit gebeuren, anders komen de meldingen mogelijk niet bij de gebruikers op de volglijst terecht. En dat is nu net de reden waarom dat sjabloon geplaatst moet worden. Edoderoo (overleg) 14 sep 2020 10:37 (CEST)[reageer]
Daarbij had dat sjabloon gisteren geplaatst moeten worden, en niet een dag voor de afhandeling. Het lijkt me daarom raadzaam om dat toch maar met de hand te gaan doen. En waar nodig ook de nodige gebruikers op de hoogte te stellen. Dat het veel werk is, is een consequentie van een massanominatie, en mag nooit een reden zijn dit maar achterwege te laten. Edoderoo (overleg) 14 sep 2020 10:44 (CEST)[reageer]
Zoiets kan beter via een stemming. Wat betreft je bewerkingslimiet: waarschijnlijk kun je wel ontheffing krijgen, zodat je de stempagina onbeperkt mag bewerken als coördinator. Wikiwerner (overleg) 14 sep 2020 18:19 (CEST)[reageer]
  Niet uitgevoerd Geen consensus op Wikipedia:Te beoordelen pagina's/Toegevoegd 20200913, sterker nog de nominatie is doorgehaald. Japiot (overleg) 15 sep 2020 15:18 (CEST)[reageer]

Synthesizer (muziekinstrument) omzetten naar Synthesizer (hoofdbetekenis)

Nadat ik gisteren een stuk of honderd links naar Synthesizer (muziekinstrument) heb omgezet (waar ik achteraf langer over had moeten nadenken), werden we het er hier over eens dat een hoofdbetekenisconstructie gepaster is. Kan een bot de links Synthesizer (muziekinstrument) omzetten naar Synthesizer (hoofdbetekenis)? Encycloon (overleg) 15 feb 2021 11:52 (CET)[reageer]

Ten eerste is dat overbodig (WP:REP), ten tweede is er geen consensus gebleken voor een hoofdbetekenis, en het omzetten van een reguliere dp in een hoofdbetekenisconstructie is een schending van WP:BTNI. — Zanaq (?) 15 feb 2021 11:59 (CET)
  Steun Het standaardbezwaar van Zanaq begint inmiddels tot de Wikipedia-tradities te behoren. Dat betekent niet dat er geen consensus is. The Banner Overleg 15 feb 2021 12:08 (CET)[reageer]
Stop met mij woorden in de mond te leggen en stop met onzin kletsen. Het is een welbekend feit dat er nooit en te nimmer consensus is om een hoofdbetekenis aan te leggen. Voor de zoveelste keer de vraag: kan je een geval laten zien waarbij er wel consensus aangetoond is? — Zanaq (?) 15 feb 2021 12:37 (CET)
Precies, er is altijd wel een Zanaq bij de hand om te protesteren. Maar consensus is niet hetzelfde als unanimiteit. The Banner Overleg 15 feb 2021 12:43 (CET)[reageer]
Stop met mij woorden in de mond te leggen en stop met onzin kletsen. Waar heb ik dat beweerd? — Zanaq (?) 15 feb 2021 12:51 (CET)
Dan stop eens met het altijd en overal bezwaar maken tegen een hoofdbetekenis met de claim dat er geen consensus is. En dit verzoek past duidelijk in jouw project-verstorende WP:PUNT-campagne. The Banner Overleg 15 feb 2021 13:12 (CET)[reageer]
Als men zou handelen volgens de feiten is het niet nodig de feiten nog eens te noemen. Het is irritant, maar kennelijk nodig het steeds te zeggen: Er is nooit en te nimmer consensus voor een hoofdbetekenisconstructie!. Als men dat eens zou accepteren. Of de vraag beantwoorden waar er ooit consensus is gebleken voor een hoofdbetekenisconstructie. — Zanaq (?) 15 feb 2021 13:16 (CET)
Als jij nu eens ging handelen conform de feiten! The Banner Overleg 15 feb 2021 13:38 (CET)[reageer]
Het is inderdaad erg moeilijk om vragen te beantwoorden. — Zanaq (?) 15 feb 2021 14:28 (CET)
Wanneer hebben jullie nou een keer door dat dit soort geruzie echt heel vervelend is? Zoek een bemiddelaar, want iedereen is jullie onvriendelijkheid spuugzat. Vinvlugt (overleg) 15 feb 2021 15:26 (CET)[reageer]
Ik overweeg een peiling op te zetten om te zien of er inderdaad nimmer consensus is of dat er soms wel consensus mogelijk is. The Banner Overleg 15 feb 2021 15:31 (CET)[reageer]
Doe vooral wat je niet laten kunt, maar je gaat niet in op mijn punt: houd eens op diverse discussies te verpesten met jullie onvermogen om als volwassenen met elkaar om te gaan. Vinvlugt (overleg) 15 feb 2021 15:33 (CET)[reageer]
Wederom vind ik het niet fijn om met The Banner over een kam geschoren te worden. Het is The Banner die de hele tijd mijn (en andermans) woorden verdraait of meningen en intenties toeschrijft die verder nergens uit blijken, en vragen waar hij dat op baseert nooit beantwoordt. Ik reageer inderdaad niet meer vriendelijk op die ongein, maar kan ik het negeren als mij van alles toegeschreven wordt? — Zanaq (?) 16 feb 2021 11:11 (CET)
Jouw verhaaltje van "er is nimmer consensus voor een hoofdbetekenisconstructie" is nergens anders op gebaseerd dat jouw eigen mening. Niet op feiten. The Banner Overleg 16 feb 2021 11:47 (CET)[reageer]
Dat is onzin. Waar is dat op gebaseerd? En dan is het vast niet moeilijk de vraag waar er ooit consensus is gebleken voor een hoofdbetekenisconstructie te beantwoorden. — Zanaq (?) 16 feb 2021 11:50 (CET)
Amsterdam? The Banner Overleg 16 feb 2021 12:08 (CET)[reageer]
De vraag was waar de consensus is gebleken. — Zanaq (?) 16 feb 2021 12:10 (CET)
Die blijkt toch uit het feit dat niemand die constructie daar meer ter discussie stelt? Behalve jij misschien. Vinvlugt (overleg) 16 feb 2021 12:37 (CET)[reageer]
Nee dat blijkt daar niet uit. — Zanaq (?) 16 feb 2021 12:39 (CET)
Dan hebben jij en ik een ander idee van wat consensus inhoudt. Vinvlugt (overleg) 16 feb 2021 16:02 (CET)[reageer]
Nee, wat consensus is staat gewoon op Wikipedia:Consensus. Er is vast consensus dat we niet moeilijk doen over bestaande hoofdbetekenisconstructies. Zie je mij moeilijkheden maken om bestaande hoofdbetekenisconstructies? Waar heb ik ooit bezwaar gemaakt tegen een hoofdbetekenisconstructie op Amsterdam, behalve in reactie op ongelovige vragen van voorstanders als "zou je werkelijk haakjes achter Amsterdam willen plaatsen" of in een algemene discussie? Dit is weer nodeloze afleiding, en de vraag is nog niet beantwoord. Uiteraard bedoel ik voorafgaande expliciete consensus maar was het echt nodig dat te melden? — Zanaq (?) 16 feb 2021 16:10 (CET)
Het zijn zo snel geteld 420 links, dus dat is een volle dag werk om met de hand te doen. Bij een hoofdbetekenisconstructie is het wel raadzaam om de links naar de hoofdbetekenis om te zetten, maar volgens mij is daar ook niet per se haast bij nodig? Die constructie is er juist voor om de links zorgvuldig (lees: met extra controle) om te zetten, om die paar uitzonderingen er nog uit te kunnen filteren. Die paar uitzonderingen linkten voor de actie van Encycloon ook al verkeerd. Het lijkt me een klusje om met AWB en wat extra controle uit te voeren. Edoderoo (overleg) 15 feb 2021 12:15 (CET)[reageer]
Ik vroeg geen omzetting van Synthesizer, maar van Synthesizer (muziekinstrument). Die laatste groep staat gegarandeerd wel goed. Encycloon (overleg) 15 feb 2021 12:22 (CET)[reageer]
Als die omzetting overbodig is, kan het verzoek uiteraard worden afgewezen. Encycloon (overleg) 15 feb 2021 12:41 (CET)[reageer]
Hier had iemand ten onrechte een desambiguatie-toevoeging aangebracht. De toevoeging was ten onrechte, want ook drie dagen later zijn er nog steeds geen andere artikelen. Dat er een hoofdbetekenis is, dat is tamelijk duidelijk, vooralsnog zijn er zelfs geen andere artikelen! Op dit moment staat er een Paraguayconstructie met een rode link. Dat lost op dit moment tijdelijk de situatie op, maar het lijkt me wel wenselijk om, bijvoorbeeld in overleg met degene die de voorbarige desambiguatie uitvoerde, Djsgmnd, na te gaan of er binnen 1 of 2 weken andere artikelen gaan komen of niet, en zo ja of dat 1 ander artikel is ofwel meer dan 1. Als dat helder is, kan overleg volgen over de definitieve richting van de uit te voeren correctie. Bob.v.R (overleg) 15 feb 2021 14:01 (CET)[reageer]
Als er geen andere encyclopedische betekenis is, en er dus ten onrechte gedesambigueerd wordt, dan gaan we daar natuurlijk geen hoofdbetekenisconstructie voor aanleggen. In dat geval had de onterechte dp gewoon verwijderd moeten worden, wmb liefst via het reguliere proces. — Zanaq (?) 15 feb 2021 14:31 (CET)
Op dit moment neig ik ernaar dat die rode link beter weg kan: het is volkomen onduidelijk wat er bedoeld wordt. Maar misschien stond dat op de verwijderde dp, die ik niet kan inzien. De insteek moet mi zijn dat als er een normale dp wordt omgezet in een hoofdbetekenisconstructie, dat daar eerst consensus voor is aangetoond, of een stemming is gehouden, per WP:BTNI. De insteek moet mi ook zijn dat als iemand een dp aanlegt dat niet meteen krampachtig wordt geprobeerd er een hoofdbetekenisconstructie van te maken (wat mi dus niet is toegestaan) maar dat men eerst kijkt of desambiguatie überhaupt nodig is of dat er nog meer betekenissen zijn. Er zijn hier mi gewoon een paar stappen overgeslagen. — Zanaq (?) 15 feb 2021 15:59 (CET)
Ik wil graag zien dat alle aangepaste linkjes naar "Synthesizer (muziekinstrument)" weer teruggedraaid worden naar "Synthesizer" omdat dit de meest gelinkte betekenis is aan die pagina, en dat alleen de pagina "Synthesizer (apparaat)" met toegevoegde haakjes beschikbaar komt. Mocht er meer dan 1 andere betekenis zijn, dan kan een pagina met "Synthesizer (doorverwijspagina)" er altijd nog komen, lijkt me. Verdel (overleg) 15 feb 2021 15:23 (CET)[reageer]
Zolang Synthesizer (apparaat) een rode link is, lijkt het me niet fraai om deze rode link te zien in een paraguayconstructie. De huidige situatie op het artikel Synthesizer ( paraguayconstructie met een 'rode link' naar Synthesizer (apparatuur) ) zie ik als iets tijdelijks, zodat overleg plaats kan vinden. Als er volgens de overleggers een reden is om een dergelijke rode link ergens te kunnen vinden (ik wil dan wel graag weten wat die reden is en aan wat voor type apparatuur er concreet gedacht wordt), dan lijkt een hbc (hoofdbetekenisconstructie) mij het beste. Bob.v.R (overleg) 15 feb 2021 15:41 (CET)[reageer]


Dat is zoals gezegd en gelinkt dus niet nodig. — Zanaq (?) 15 feb 2021 16:04 (CET)
Voor de duidelijkheid:
(wijz) 14 feb 2021 20:49 . . Encycloon (overleg | bijdragen | blokkeren) 88 bytes ((Kennelijk) meer betekenissen) Label: Doorverwijzing verwijderd
(wijz) 12 feb 2021 12:33 . . Djsgmnd (overleg | bijdragen | blokkeren) 50 bytes (Djsgmnd heeft pagina Synthesizer hernoemd naar Synthesizer (muziekinstrument): Een synthesizer wordt ook in radio-, c.q. zend- en ontvangapparatuur toegepast)
Inhoud doorverwijspagina:
Encycloon (overleg) 15 feb 2021 16:08 (CET)[reageer]
Het verwijderen van een doorverwijspagina is niet zo chique naar mijn idee, en het botst ook met de licentie. Er zijn nu zaken verstopt, waardoor ook de discussie vertroebeld. Een andere gebruiker op deze manier overrulen door pagina's te verwijderen, is niet de gewenste methode. Edoderoo (overleg) 15 feb 2021 17:33 (CET)[reageer]
Maar dat is juist het hele punt hier: ik heb feitelijk alleen mezelf overruled (ík maakte op 14 februari de doorverwijspagina aan). Of bedoel je de titelwijziging op 12 februari? Encycloon (overleg) 15 feb 2021 19:11 (CET)[reageer]
Ik denk dat ik inmiddels ook de bomen niet meer zie, omdat het bos in de weg staat. Edoderoo (overleg) 15 feb 2021 20:08 (CET)[reageer]
Het bovenstaande heb ik eerlijk gezegd niet gelezen, maar is Directe digitale synthese een apparaat/techniek die te maken heeft met de synthesiser betekenissen waar het hier over gaat? Elly (overleg) 16 feb 2021 13:16 (CET)[reageer]
Ha Elly, ik denk dat dit de synthesevorm is, dus de manier waarop het digitale signaal wordt opgewekt. Volgens mij moet Synthesizer (apparaat) gebaseerd zijn op en:Frequency synthesizer. Verdel (overleg) 16 feb 2021 13:25 (CET)[reageer]
Zojuist de pagina Frequentiesynthesizer als beginnetje gestart. De hele bovenstaande constructie lijkt hiermee van de baan, en dat is misschien ook het beste om geen verwarring te creëren. De discussie is inmiddels te onoverzichtelijk geworden. Verzoek daarom graag tot afronding. Ik zie dat Zanaq wil dat er een doorverwijspagina komt, lijkt me prima. Verdel (overleg) 16 feb 2021 15:39 (CET)[reageer]
Er was al een dp. Deze kan het best teruggezet worden - wmb op de reguliere plek - zodat deze aangepast en uitgebreid kan worden. — Zanaq (?) 16 feb 2021 15:44 (CET)
Die dp bevatte enkel

{{dp}}

Zie ook

{{dpintro}}


Daar hoef je voor mij als aanmaker geen rekening met auteursrechten mee te houden hoor. Encycloon (overleg) 16 feb 2021 15:48 (CET)[reageer]
Het gaat ook een beetje om het principe. Als ik een dp aanleg zal dat een reguliere dp worden. — Zanaq (?) 16 feb 2021 15:50 (CET)
Ja, dat was me wel duidelijk. Encycloon (overleg) 16 feb 2021 15:53 (CET)[reageer]
  Opmerking verzoek ingetrokken. De redirect is op zich niet fout en de discussie gaat inmiddels meer over andere zaken. Mocht elders toch weer behoefte blijken aan een botactie dien ik wel een nieuw verzoek in. Encycloon (overleg) 16 feb 2021 15:53 (CET)[reageer]

Update tellers op Help:Veelvoorkomende spelfouten

Een hele tijd geleden heb ik op Help:Veelvoorkomende spelfouten bij elke veelvoorkomende spelfout een teller toegevoegd die (bij benadering) het aantal voorkomens in de hoofdnaamruimte weergeeft. Dit geeft een heel goed overzicht van welke spelfouten nog frequent worden gemaakt met als doel dat gebruikers die zich voornamelijk met dat soort fouten bezighouden makkelijk kunnen werken. Vroeger werd dit geüpdatet door de bot van Bdijkstra, Bitbotje, maar vertelde onlangs op de overlegpagina dat dit veel tijd en moeite vraagt voor de bot. Nu vroeg ik me af of er een andere gebruiker met een botbitje eens kan bekijken in hoeverre hij dit kan aanpakken. Het zou een hele hulp zijn, want manueel de tellers aanpassen is veel te veel werk. JP001 (Overleg)   3 aug 2020 14:07 (CEST)[reageer]

Dat heb ik niet gezegd. Ik heb gezegd dat het een zware last is voor de WikiMedia-servers omdat de zoekopdrachten niet gebruikmaken van een zoekindex. Het updaten van de zoekopdrachten is (grotendeels) handwerk. –bdijkstra (overleg) 3 aug 2020 17:42 (CEST)[reageer]
Ik begrijp niet goed dat als er een zoekindex met dubbele aanhalingstekens aan toe wordt gevoegd dit het een minder zware last zou maken. De reguliere expressie die staat er dan toch nog steeds? Het moet toch op een manier te doen zijn? De Engelstalige Wikipedia maakt ook vaak gebruik van reguliere expressies. Daarbij een zware last wil toch niet zeggen dat het niet te doen is? Het zal gewoon meer tijd en inspanning van de server vragen. JP001 (Overleg)   6 aug 2020 17:36 (CEST)[reageer]
De vraag is wat de meerwaarde is van het bijwerken van deze tellertjes ten opzichte van de belasting van de servers. Wikipedia heeft het delen van kennis voorop staan, niet het bijwerken van tellertjes van iets dat de gewone gebruiker niet ziet. Duurzaamheid is ook iets dat Wikimedia belangrijk vindt. Is het dan wenselijk om hiervoor en de computer van de botbeheerder en het serverpark in Amerika en alles wat nodig is voor de verbinding intensief in te zetten voor dit lijstje tellers? Het doorzoeken van teksten is iets dat geen gebruik maakt van indexen, dus om te zoeken hoe vaak 'happerdeflatst' in de Nederlandse Wikipedia staat, moet de tekst van alle ruim 2 miljoen pagina's in de encyclopedie opgehaald en doorzocht worden. Dat is prima als het zinvol is omdat iemand echt op zoek is naar 'happerdeflatst', maar minder om te constateren dat dit 21 keer gebruikt wordt, en nog minder als al is vastgesteld dat er daarvan zeventien terecht zijn. Het is nuttiger om dan te zorgen dat die vier keer opgelost worden, zodat er verder geen aandacht meer aan geschonken hoeft te worden.
Computers kunnen heel veel, en een stuk sneller dan mensen, maar het toenemende gebruik van computers leidt ook tot een steeds grotere stroomvraag. Dat kunnen we beter gebruiken voor zaken die meer zin hebben. Met vriendelijke groet, RonnieV (overleg) 6 aug 2020 18:05 (CEST)[reageer]
Mij lijkt het niet echt onnuttig. Er is ook steeds een bot actief die gesprekken tussen Wikipedianen archiveert. Dat ziet de lezer ook niet, maar is wel nodig. Aan de hand van tellers kunnen Wikipedianen heel gericht zulke fouten aanpakken. Ook fouten die anders moeilijker op te sporen waren. Iedereen hecht natuurlijk een ander belang aan "kleine" spelfouten, maar zo kan je verschillende wijzigingen in vraag stellen. Ik zag ook dat Algont ook vaak gebruikmaakt van de pagina. Misschien dan een kleine oproep naar haar om na een resem van bewerkingen gedaan te hebben ook manueel de tellers bij te werken (liefst per letter). Met vriendelijke groeten JP001 (Overleg)   6 aug 2020 19:05 (CEST)[reageer]
Of de teller nu wel of niet wordt bijgewerkt, als jij die spelfouten wilt verbeteren, zul je ze toch eerst zelf moeten opzoeken. Dan kun je met het zoekresultaat ook gelijk de teller bijwerken. Alleen de teller bijwerken doet niets met het aantal dat gevonden is, en de persoon die er mee aan de slag wil, moet de zoekopdracht toch opnieuw ingeven. Edoderoo (overleg) 6 aug 2020 19:20 (CEST)[reageer]
De teller is gelijk aan de zoekopdracht omdat dit een link is naar de zoekopdracht. Het is juist wel nodig om ze te updaten. Je kan toch niet elke teller opnieuw gaan bekijken om te zien of dat deze wel effectief 0 zoekresultaten (of enkele false positives) oplevert? Een maandelijkse update zou al voldoende zijn. Dit moet niet elke dag bijgewerkt worden natuurlijk. JP001 (Overleg)   6 aug 2020 19:49 (CEST)[reageer]
Klik er dan vooral zelf op, want het is mij inmiddels wel duidelijk dat anderen dat voor jou niet gaan doen. Edoderoo (overleg) 6 aug 2020 20:33 (CEST)[reageer]
  Niet uitgevoerd Het is handwerk om de zoekopdrachten aan te passen zodat deze behapbaar zijn voor onze servers. Daarna kan er eventueel een nieuw verzoek komen. Het botscript ligt immers klaar. Wikiwerner (overleg) 1 mei 2021 14:19 (CEST)[reageer]

Uitgevoerde verzoeken

Bronvermelding bij Amsterdamse straten

Het is iets kleins, maar het is ook makkelijk aan te pakken met een bot of met AWB. In alle artikelen wordt namelijk deze bron gebruikt:

<ref>de Naam van onze straat, J.A.Wiersma 1978</ref> 

Dit is nogal een vreemde opmaak van een bron, zeker met de willekeurig hoofdletter N en geen hoofdletter aan het begin van de titel. Aangezien dit op 64 artikelen voorkomt, is het nogal veel voor mij om dit handmatig te fiksen. Ik stel voor om de bron meteen volgens de bronconventies te plaatsen, namelijk zo:

<ref>Wiersma, J.A. (1978) ''De naam van onze straat''.</ref>

Verder komen er vaak dubbele spaties voor op de artikels die dan meteen in deze wijzigingen mee eruit gehaald kunnen worden. Hopelijk is er iemand die dit klein karweitje op zich wil nemen. – De voorgaande bijdrage werd geplaatst door JP001 (overleg · bijdragen) 10 aug 2020 20:12 (CEST)[reageer]

Doe het dan in één keer goed:
<ref>Wiersma, J.A. (1978) ''De naam van onze straat''. Amsterdam : Stadsdrukkerij van Amsterdam. {{ISBN|90-6274-006-5}}</ref>
Zie hier. Wutsje 10 aug 2020 20:21 (CEST)[reageer]
Dan liever zo:
<ref>Wiersma, J.A. (1978) ''De naam van onze straat. Geschiedenis en verklaring van de straatnamen in Amsterdam'', Amsterdam: Stadsdrukkerij van Amsterdam</ref>
(isbn-nummer hoeft niet in een bronvermelding, kan wel in een bronnen- of literatuurlijst onderaan het lemma, is ook ongebruikelijk op wp:nl middenin de tekst) HT (overleg) 10 aug 2020 20:53 (CEST)[reageer]
Zolang dat tussen de <ref>-tags staat, staat het ook onderaan, en niet midden in de tekst, dus ik snap die opmerking niet zo. Edoderoo (overleg) 10 aug 2020 20:56 (CEST)[reageer]
@Edoderoo Ongebruikelijk op wp:nl in een bronvermelding. HT (overleg) 10 aug 2020 21:01 (CEST)[reageer]
Doe het dan in één keer goed: Hongaren schrijven eerst de achternaam en dan de voornaam. Wij niet. Handige Harrie (overleg) 10 aug 2020 21:06 (CEST)[reageer]
(na 3x bwc) Wat Edo zegt. De ondertitel mag echter inderdaad wel worden vermeld, maar dan zo:
<ref>Wiersma, J.A. (1978) ''De naam van onze straat : Geschiedenis en verklaring van de straatnamen in Amsterdam''. Amsterdam : Stadsdrukkerij van Amsterdam. {{ISBN|90-6274-006-5}}</ref>
Let op de spaties voor de dubbele punten: die zijn niet triviaal, vraag maar aan een bibliothecaris. Er is niets mis met het vermelden van het ISBN, zeker niet als duidelijk is dat specifiek die tweede druk is gebruikt. Dat zulks op Wikipedia ongebruikelijk zou zijn, is aantoonbaar niet waar, zie bv. hier. Wutsje 10 aug 2020 21:11 (CEST)[reageer]
Laat ik zeggen dat het gebruik van isbn-nummers in een bronvermelding op wp:nl ver in de minderheid is en in die zin ongebruikelijk. HT (overleg) 10 aug 2020 21:15 (CEST)[reageer]
99% van de bronvermeldingen betreffen {{Citeer web}}, maar dat betekent toch niet dat die andere 1% niet juist is? Edoderoo (overleg) 10 aug 2020 21:21 (CEST)[reageer]
Geheel terzijde: de Wikipedia ontvallen BesselDekker kon, niet onbegrijpelijkerwijze, schuimvlokken in z'n mondhoeken krijgen van de term isbn-nummer. Vgl. ook apk-keuring. Wutsje 10 aug 2020 21:41 (CEST)[reageer]
Dan zou tl-buis of lcd-scherm zeker ook een probleem zijn, maar ja, die staan net als apk-keuring gewoon op de woordenlijst van de Taalunie ([4], [5] en [6]). - Robotje (overleg) 12 aug 2020 12:33 (CEST)[reageer]

  Uitgevoerd Tussen de opmerking van Wutsje en nu is het klusje al geklaard; dus inclusief het ISBN nummer Japiot (overleg) 10 aug 2020 21:32 (CEST)[reageer]

@Edoderoo Het gaat niet om goed of fout. Nogmaals: alle denkbare variaties zijn op wp:nl mogelijk. HT (overleg) 10 aug 2020 21:50 (CEST)[reageer]

Toch niet alle pagina's kunnen meenemen in de botwijziging, zo blijkt. JP001 (Overleg)   12 aug 2020 00:07 (CEST)[reageer]

De regel waarnaar ik met AWB zoekt bevat kleine verschillen, zoals punten en komma's in de zoekstring. Ik heb de 22 van de search handmatig aan AWB toegevoegd. Pas bij een nieuwe dump kan ik zien of het nu

kompleet is. Japiot (overleg) 12 aug 2020 13:13 (CEST)[reageer]

Maar waarom corrigeer je nu gewoon de hoofdletters en gebruik je niet de volledige bronvermelding met isbn-nummer zoals hierboven? JP001 (Overleg)   12 aug 2020 13:20 (CEST)[reageer]
Maar dan is het echt handwerk! Japiot (overleg) 12 aug 2020 13:26 (CEST)[reageer]

Linkfix naar Henri Filhol

Er is nu artikel over zoöloog Henri Filhol. Ik vond zeker 24 artikelen over ongewervelde dieren waarin de zin "geldig gepubliceerd in 1885 door Filhol" en daarnaast nog tientallen auteursvermeldingen, zonder link naar het artikel. Kan zeker in de woordcombinatie "door Filhol" vervangen worden door "door Filhol"? HWN (overleg) 15 sep 2020 10:55 (CEST)[reageer]

Opmerking voor de uitvoerder: labels van externe links graag uitsluiten, dat ging een aantal keer fout bij een soortgelijke actie. –bdijkstra (overleg) 15 sep 2020 11:46 (CEST)[reageer]
  Uitgevoerd "door Filhol", "auteur = Filhol" en "(Filhol, ) aangepast. Bij de laatste de referenties naar externe links overgeslagen. Japiot (overleg) 15 sep 2020 12:22 (CEST)[reageer]

Referrers in url's

Misschien is het mogelijk zaken als ?source en ?referrer=... en ?harvest_referrer=... met een bot uit url's te verwijderen. De hele string vanaf het vraagteken tot de eerstvolgende spatie moet dan weg. ErikvanB (overleg) 3 okt 2020 16:38 (CEST)[reageer]

Nu schiet me ineens een eerder verzoek uit het Botcafé te binnen. Ik had niet in de gaten dat die alweer gearchiveerd was. Wikiwerner (overleg) 3 okt 2020 22:02 (CEST)[reageer]
Ah, inderdaad. utm_source + utm_campaign. Maar dat is misschien lastiger. ErikvanB (overleg) 4 okt 2020 05:31 (CEST)[reageer]
Met regex moet je alles vanaf utm_source, utm_campaign etc. tot aan de eerstvolgende & verwijderen. Op die manier moet het veilig kunnen. In een URL is een ampersand het begin van een nieuwe parameter. En uiteindelijk nog even controleren of op een ? een spatie volgt. Zo ja, dan kan die ook nog weg. Mbch331 (overleg) 4 okt 2020 08:06 (CEST)[reageer]
Als ik (handmatig) zulke referrers tegenkom, veranders ik ze het liefst in ?referrer=nl.wikipedia.org of iets van die smaak. Moet ik altijd wel even controleren of de URL dan werkt, maar vaak wel. Edoderoo (overleg) 4 okt 2020 08:57 (CEST)[reageer]
Zie ook de regexen in de zoekopdrachten die ik toen in het botcafé dropte; iets aangepast: UTM-parameters en click identifiers (o.b.v. de in en:Click identifier genoemde), idem voor de door ErikvanB genoemde referrers (of alle source*-parameters net zo klakkeloos verwijderd kunnen worden zonder de werking van de link aan te tasten, ben ik minder zeker over). Beginnend met een vraagteken, dan die laten staan (tenzij dan niets meer volgt); beginnend met een ampersand, dan die verwijderen. Wellicht dat er nog andere tekens uitgesloten moeten worden van de parameterwaarde? Bijvoorbeeld regeleindes (of de multiline-vlag); ik weet niet welke regex-smaak gebruikt wordt. Een check of de match in een daadwerkelijke url staat (en bijvoorbeeld niet als zichtbare tekst als inhoudelijk onderdeel van het verhaal), lijkt me geen overbodige luxe.
Heeft het vervangen van een referrer-waarde door 'nl.wikipedia.org' een toegevoegde waarde voor Wikipedia? Of dient het slechts dataverzamelende marketingdoeleinden van de betreffende websites (of iets daar tussenin)?
Met vriendelijke groeten — Mar(c).[overleg] 4 okt 2020 13:53 (CEST)[reageer]
Controleren of het daadwerkelijk in een URL staat, kan met (?<=https?://[^ \]|}]*). Wikiwerner (overleg) 4 okt 2020 15:13 (CEST)[reageer]
  Uitgevoerd Ik heb de meeste opgeruimd. Ik heb het laten staan als er bijv. referrer=Wikipedia staat, of als er {{Dode link}} achter staat. Wikiwerner (overleg) 13 okt 2020 22:26 (CEST)[reageer]
Bedankt voor het opruimwerk! Enkele opmerkingen/vragen:
  1. Bij de overgebleven 85 pagina's met (harvest_)referrer, waarvan 50 in de hoofdnaamruimte, zie ik bij de eerste vijf een url met refURL=https://en.wikipedia.org/&referrer=https://en.wikipedia.org/ (in Ariana Grande), en in Lijst van bekende honderdplussers staat een referrer=https://nl.wikipedia.org/wiki/Ria_van_Dijk. Deze lijken me sowieso incorrect, tenzij we bewust dataverzamelende marketeers willen misleiden (als dat al lukt op deze manier). Maar goed: zie 2.
  2. Hierboven had ik de vraag ook al gesteld: wat is überhaupt de toegevoegde waarde van iets als referrer=Wikipedia of referrer=nl.wikipedia.org?
  3. Indien er nog een run gedaan wordt: ik had hierboven de /i-vlag in de regex vergeten; er zijn ook 9 pagina's met Referrer (waarvan 1 in de hoofdnaamruimte).
  4. Wat me verder direct opvalt bij deze resultaten van 1: die url in Ariana Grande is https://www.forbes.com/forbes/welcome/?toURL=https://www.forbes.com/sites/..., en in Hudson's Bay Company staat een link https://www.ad.nl/privacy-gate/accept?redirectUri=%2feconomie%2f... (in dit geval is de ref trouwens in feite gelijk aan de direct volgende). Het lijkt me gewenst om dit soort indirecte links te vervangen door een directe url, met een aanvullende check op gelijke refs. Dat is vast botmatig mogelijk (183 pagina's met toURL of redirectUri of callbackUrl, waarvan 169 in de hoofdnaamruimte); een nieuw botverzoek hiervoor is dan wellicht handig, voordat deze referrers-verwijdering nogmaals uitgevoerd wordt. (Het staat me trouwens bij dat dit type links recent al ergens ter sprake is gekomen.)
  5. Van de eerder geconstateerde 1250+ pagina's met UTM-parameters zijn er nog 324 pagina's over, waarvan 174 in de hoofdnaamruimte. Zijn deze bewust zo gelaten? (Overigens heeft van de bovenste vijf hits – Verenigde Staten, Tennis, YouTube, Syrië, Dordrecht – alleen de laatste een 'Wikipedia-referrer': utm_source=wikipedia.)
Met vriendelijke groeten — Mar(c).[overleg] 14 okt 2020 14:07 (CEST)[reageer]
Gevallen zoals referrer=Wikipedia heb ik overgeslagen omdat Edoderoo die altijd plaatst als hij een referrer tegenkomt. Die ga ik daarom niet zomaar weer weghalen. De redirect-url's van punt 4 kunnen inderdaad eventueel vervangen worden na een nieuw botverzoek. AutoWikiBrowser controleert vervolgens automatisch op dubbele referenties: als meerdere ref-tags dezelfde inhoud hebben, dan worden deze vervangen door "ref name=" (zie Help:Referenties en voetnoten#Meerdere verwijzingen naar dezelfde voetnoot). Wat betreft punt 5: ik denk dat ik gezocht heb met de link van ErikvanB in plaats van met bijv. insource:/utm_/. Ik zal kijken wanneer ik zin heb om verder te vegen. Wikiwerner (overleg) 14 okt 2020 19:10 (CEST)[reageer]
De toegevoegde waarde is er niet voor ons, wel voor de site die de URL host, die kan daarmee zien dat er bezoekers via Wikipedia komen. De kans is klein dat ze daar iets mee doen, want vaak worden die referrers gebruikt om te zien welke advertentie-campagnes zin hebben. Edoderoo (overleg) 14 okt 2020 19:44 (CEST)[reageer]
Het lijkt me dat daarvoor de referrer in de HTTP header afdoende is, en als die methode tegenwoordig te onbruikbaar is (vanwege verwijdering/aanpassing van de referrer door browsers e.d.), dan is daar een goede reden voor die dan ook tegen herfacilitering via url-parameters pleit. Mocht zo'n url-parameter werkelijk gewenst zijn, dan lijkt het me beter dat de MW-software deze 'onclick' aan externe links toevoegt, zoals die dat ook met links in de zoekresultaten doet (de parameter wprov). Met vriendelijke groeten — Mar(c).[overleg] 14 okt 2020 23:01 (CEST)[reageer]
Zo, ik ben klaar met verder opruimen. Wikiwerner (overleg) 29 nov 2020 13:15 (CET)[reageer]

Plaatsen in Slovenië die deel uitmaken van een Sloveense gemeente

Er zijn in 2008 botmatig duizenden artikelen aangemaakt over plaatsen in Slovenië. Deze hebben standaard de formulering "A is een plaats in Slovenië en maakt deel uit van de Sloveense gemeente B" als definitie. Nu is het weinig bijzonder dat een plaats in Slovenië deel uitmaakt van een Sloveense gemeente, dus dat woord "Sloveense" kan er n.m.m. simpelweg uit weggelaten worden. Daarbij kan worden gekozen om het woord "gemeente" nog steeds wel te linken (let er er daarbij wel op dat [[Sloveense gemeente]] in 2015 een redirect is geworden naar Lijst van Sloveense gemeenten, dus het lijkt beter om dat dan maar meteen om te zetten) of om het niet te linken (hoe functioneel is het eigenlijk?). Het gaat momenteel om maar liefst 5.600 van zulke artikelen. Ziet iemand er wat in? Groet, Apdency (overleg) 3 okt 2020 11:31 (CEST)[reageer]

Dan liever niet linken naar de lijst: de pagina's over de gemeenten zijn de plaats om daarheen te linken, bijv. onder een kopje "Zie ook". Wikiwerner (overleg) 3 okt 2020 12:25 (CEST)[reageer]
De links tegelijk met het woord "Sloveense" verwijderen lijkt me helemaal prima. Apdency (overleg) 3 okt 2020 12:37 (CEST)[reageer]
  Uitgevoerd 5602 artikelen aangepast. Mijn bot deed daar 14 uur over! Japiot (overleg) 20 nov 2020 12:12 (CET)[reageer]
Par-don? Dat noem ik indrukwekkend. Maar bovenal hartelijk dank, Japiot! Groet, Apdency (overleg) 17 dec 2020 20:30 (CET)[reageer]

Bronvermeldingen actualisatie

Op Wikipedia staan op dit moment in meerdere talen bronvermeldingen naar de websites TracesOfWar.com en .nl (EN-NL tweetalig), maar ook naar de voormalige websites ww2awards.com, go2war2.nl en oorlogsmusea.nl. Deze websites zijn echter in de afgelopen jaren geïntegreerd in TracesOfWar, waardoor de bronvermelding dus nu in ongeveer 1.200 pagina's en een veelvoud bronvermeldingen dus incorrect is. Er is op dit moment gelukkig nog een situatie waarbij ww2awards en go2war2 doorlinkt naar de juiste pagina op TracesOfWar, maar voor oorlogsmusea.nl is dat al niet meer het geval (Voorbeeld Willy Kreitz). Ook bij ww2awards en go2war2 gaat dat op korte termijn stoppen, ergo duizenden dode links dan tot gevolg, terwijl het goedgezet kan worden richting effectief dezelfde bron. Nu ben ik zelf een slag gaan maken door bronnen om te zetten, maar na een stuk of 50 wijzigingen zakt mij enigszins de moed in de schoenen om dit nog zeker 1.150 keer handmatig te doen.

Is er een manier waarop dit mogelijk in bulk kan? Een kort voorbeeld: persoon Courtney Hodges (bij Tracesofwar persons id 41204) heeft nu een bronvermelding naar http://en.ww2awards.com/person/41204, maar dit moet anno 2021 zijn https://www.tracesofwar.com/persons/41204/. Kortom, oud format naar nieuw format qua url, maar zelfde ID. Dat zou het mogelijk moeten maken naar mijn idee om alles met format 'http://en.ww2awards.com/person/[id]' of 'http://nl.ww2awards.com/person/[id]' om te zetten naar respectievelijk 'https://www.tracesofwar.com/persons/[id]' en 'https://www.tracesofwar.nl/persons/[id]'. Hetzelfde is van toepassing op go2war2.nl en oorlogsmusea.nl naar tracesofwar.nl; met iets andere formatting. Is dit mogelijk? Lennard87 (overleg) 19 apr 2021 15:52 (CEST)[reageer]

  • Hallo Lennard87, Ik denk wel dat dat mogelijk is, maar ik twijfel een beetje over de noodzaak. Dat de links nu over redirects gaan is op zich geen ramp, het werkt verder prima. Bij oorlogsmusea.nl was dat inderdaad niet het geval, dus die links heb ik inmiddels aangepast, maar zolang als de redirects werken kunnen we het misschien beter zo laten. Je zegt dat het doorlinken van ww2awards en go2war2 binnenkort gaat stoppen. Is dat zo? Weet je binnen welke termijn dat ongeveer gaat gebeuren? Met vriendelijke groet, --Strepulah (💬) 24 apr 2021 18:46 (CEST)[reageer]
    Dat soort redirects hebben in mijn ervaring altijd een beperkte houdbaarheid. Nu kunnen we de ze nog gebruiken om de links om te zetten, later niet meer. Het is in principe geen ingewikkelde omzetting, maar misschien zijn er uitzondering waar we niet vanaf weten. Beter het zekere voor het onzekere nemen, lijkt me. –bdijkstra (overleg) 24 apr 2021 19:04 (CEST)[reageer]
      Uitgevoerd Allen omgezet naar TracesOfWar. Met vriendelijke groet, --Strepulah (💬) 25 apr 2021 23:03 (CEST)[reageer]
    Fijn dank je wel Strepulah! Groet, Elly (overleg) 26 apr 2021 00:34 (CEST)[reageer]
    Bedankt Strepulah! Ik zie echter wel dat dit nu alleen bij Nederlandse artikelen gebeurd is. Moet ik hiervoor een apart verzoek indienen bij elke taalvariant? Bijvoorbeeld Ouvrage Boussois in het Engels verwijst ook naar oorlogsmusea.nl. Idem bij meerdere Franse pagina's. Lennard87 (overleg) 26 apr 2021 10:49 (CEST)[reageer]
    Excusez moi voor het beterweten: Nederlandstalige artikelen. Ik vermoed dat Strepulah zijn script mogelijk bij andere talen ook kan inzetten, maar mogelijk moet je dan aangeven bij welke talen dat gewenst is, en mogelijk heeft hij niet bij alle talen een botbit, zodat wijzigingen wat trager zouden kunnen gaan. Maar dat weet Strepulah vast dan weer beter dan ik ;-) Edoderoo (overleg) 26 apr 2021 11:19 (CEST)[reageer]
    Mijn botbit geldt alleen hier op de Nederlandstalige Wikipedia, op andere wiki's heb ik geen botbit. Op andere taalvarianten gelden andere regels. Zo lees ik op de Engelstalige Wikipedia dat The operation of unapproved bots [...] is prohibited .... Zonder botbit en op een lager tempo bewerken mag dus ook niet. Ik ben bang dat je een apart verzoek bij elke taalvariant moet indienen. --Strepulah (💬) 26 apr 2021 12:26 (CEST)[reageer]
    O volgens mij mag ik op de Franstalige Wikipedia wel los gaan. Denk ik. --Strepulah (💬) 26 apr 2021 12:31 (CEST)[reageer]
    Ja graag Strepulah. Voor de Engelstalige pagina's heb ik ondertussen een verzoek uitstaan bij en:WP:URLREQ. De rest moet dan wel handmatig lukken in de leesbare talen. Lennard87 (overleg) 29 apr 2021 22:08 (CEST)[reageer]
    @Lennard87: De Franstalige Wikipedia heb ik nu ook gedaan, de Duitstalige grotendeels. Met vriendelijke groet, --Strepulah (💬) 4 mei 2021 19:43 (CEST)[reageer]
    @Strepulah: Ik zag er inderdaad nog 5 bij de Duitstalige, die heb ik nog even handmatig aangepast. Nederlands, Frans, Duits en ook Engels daarmee afgerond. Italiaans handmatig ook gedaan. Is er nog toegang bij andere talen? Fries bijvoorbeeld? Zo niet kan dit item afgerond worden. Dank in ieder geval!
    Frysk heb ik ook gedaan. Het overige kan nog handmatig of met een verzoek op de betreffende wiki. Met vriendelijke groet, --Strepulah (💬) 5 mei 2021 18:45 (CEST)[reageer]
    @Strepulah: Ik was het botwerk nog even aan het nakijken en ik zag dat er bij zeker 88 NLtalige artikelen wel een URL is aangepast nu, maar dat de naamgeving nog 'World War 2 Awards', 'WW2Awards' of 'WW2 Awards' is. Bijvoorbeeld de 3e referentie op Govert Steen. Daarnaast zou ik nog hulp kunnen gebruiken op de Portugese Wiki, waar ik pakweg 300 originele gevallen heb gevonden. Japans met 57 en Russisch met 35 zijn ook nog wel grote, maar ik snap het als dat lastiger is qua taal. Is in ieder geval Portugees mogelijk qua bot svp? Dank! – De voorgaande bijdrage werd geplaatst door Lennard87 (overleg · bijdragen) 13 mei 2021 16:24
    @Lennard87: De namen hier op nl-wiki heb ik nou ook aangepast. Voor pt-wiki heb je als ik het goed begrijp een botstatus nodig, dus daar is een verzoek op de betreffende wiki voor nodig. Met vriendelijke groet, --Strepulah (💬) 18 mei 2021 16:41 (CEST)[reageer]

Thaise provincies

Hier is besproken om de (76) Thaise provincies te hernoemen van Changwat <naam> naar <naam> (provincie), zoals dat ook bij Utrecht (provincie) gebeurt. Ik wil dit best met de hand doen, maar misschien kunnen de titelwijzigingen ook botmatig uitgevoerd worden? Encycloon (overleg) 24 jun 2020 13:50 (CEST)[reageer]

Ik heb even gespiekt. Daar is wel een script voor te schrijven. Kost vast net iets meer tijd dan met de hand doen, maar is wel veel leuker ;-)
#move
#rename or move a page to a new name
page=pywikibot.Page(site,'The Times They Are a-Changin\' (song)')
page.move('The Times They Are a-Changin\' (nummer)','bot-request')
Dan moet ik vandaag of morgen even er voor gaan zitten... Edoderoo (overleg) 24 jun 2020 15:16 (CEST)[reageer]
Ik heb inmiddels ook ontdekt hoe Python werkt. Samen met de voorzet van Edo heb ik alle betreffende artikelen hernoemd. Ook heb ik de doorverwijspagina's aangepast die erheen linken, want op dp's linken we altijd naar de werkelijke titel, evenals het artikel Provincies van Thailand, want die staat anders vol met links naar redirects. Nu blijven alleen de categorieën nog over om te hernoemen. Officieel moeten we hiervoor naar WP:TBC, maar ik kan me voorstellen dat we deze hernoemen naar aanleiding van de consensus in het overleg dat Encycloon noemt. Wat vinden we hiervan? Wikiwerner (overleg) 18 apr 2021 17:19 (CEST)[reageer]
  Uitgevoerd en de subcategorieën voorgedragen voor hernoeming. Wikiwerner (overleg) 1 mei 2021 14:19 (CEST)[reageer]

fl.

Veel artikelen bevatten de afkorting "fl." en die is dan niet gelinkt. 95% van de gevallen betekent dit ofwel floruit ofwel Nederlandse gulden (incorrect afgekort). Het zou geweldig zijn als iemand semi-automatisch de pagina's met de afkorting kan opsporen, kan bepalen of er al een gelinkt is, en indien dat nog niet het geval is, de eerste keer dat de afkorting in die pagina wordt gebruikt, linkt naar de correcte pagina. De kans dat beide afkortingen afwisselend in hetzelfde artikel worden gebruikt, is behoorlijk klein. De andere 5% verwijst waarschijnlijk vooral naar Florida. In lijsten en op dp's kun je waarschijnlijk de afkorting iedere keer linken. Effeietsanders 19 jan 2021 03:37 (CET)[reageer]

Op dp's moet dat niet gelinkt worden, want er wordt *niet* naar doorverwezen. Edoderoo (overleg) 19 jan 2021 06:31 (CET)[reageer]
Dan moeten we stoppen om het te gebruiken. De afkorting is te slecht bekend om zonder link te gebruiken. Ook een prima acceptabele oplossing. Effeietsanders 19 jan 2021 06:42 (CET)[reageer]
Ik zie 14 dp's met "fl.". Deze kunnen worden gedaan vóór de botrun. –bdijkstra (overleg) 19 jan 2021 08:37 (CET)[reageer]
Op die 14 dp's zo je dan beter floruit voluit kunnen schrijven. Dan weten nog massa's mensen niet wat dat betekent, vermoed ik, maar de kunnen het dan opzoeken. Edoderoo (overleg) 19 jan 2021 10:47 (CET)[reageer]
Die dp's heb ik zojuist aangepast. Wikiwerner (overleg) 9 apr 2021 16:21 (CEST)[reageer]
Ook alle artikelen waarin het floruit betekent, heb ik nu aangepast. Het linken naar de gulden lijkt me lang niet altijd zinvol en wordt afgeraden op Help:Gebruik van links#Wanneer is een link functioneel?. Wikiwerner (overleg) 9 apr 2021 17:59 (CEST)[reageer]

in een auto-ongeluk > bij een auto-ongeluk

Momenteel 183 keer een foute vertaling van "in a car accident". Zeer storend en amateuristisch. ErikvanB (overleg) 23 mei 2021 04:51 (CEST)[reageer]

Fun fact: Je ziet hetzelfde vaak bij ziektes. Dan staat er dat die voorkomen "in mensen" (van het Engelse "in humans") in plaats van "bij mensen". ErikvanB (overleg) 23 mei 2021 04:57 (CEST)[reageer]
  Uitgevoerd. Met AWB 168 keer aangepast. "in een auto-ongeluk" kan wel in combinatie met het woord belanden, maar dan moet je wel goed kunnen mikken. Tevens auto-ongeluk zonder streepje aangepast. Japiot (overleg) 24 mei 2021 09:01 (CEST)[reageer]
Geweldig. Groet, ErikvanB (overleg) 24 mei 2021 17:25 (CEST)[reageer]

Herschrijving koppen resultaten talentelling

Bij pagina's als Resultaten van de talentelling per gemeente van de provincie Antwerpen (zie ook Categorie:Taalregeling in België) zie ik geregeld F i.p.v. FR en "NL& ..." i.p.v. "NL & ..." (en soms ook wél FR en "NL & ...") staan. Is daar iets aan te doen voor de mensen hier? Weet niet of zulke lijsten nou echt prioriteit hebben voor zoiets, maar hoor het graag. Mvg, Ennomien (overleg) 22 jul 2021 19:39 (CEST)[reageer]

Ik denk niet dat een bot nodig is om op een enkele pagina een aantal bewerkingen te doen. Dit is vrij eenvoudig recht te trekken, zelfs in iets als Wordpad. Met vriendelijke groet, RonnieV (overleg) 22 jul 2021 20:12 (CEST)[reageer]
Snap ik. Ik had het echter wel over meerdere pagina's, wat misschien niet geheel duidelijk was. Daarom stuurde ik die categorie mee. Ennomien (overleg) 22 jul 2021 21:04 (CEST)[reageer]
Ik zie inmiddels het het inderdaad om iets meer pagina's gaat (16 tel ik er zo snel). En met best wel wat tabellen per pagina. Zoals ik het verzoek lees, gaat het erom om de taalaanduidingen in de koppen te standaardiseren. Dat moet wel te doen zijn. Als we hier toch mee aan de slag gaan, de gebruikelijke aanduidingen voor een taal is met kleine letters: nl, fr, de. En misschien is het helemaal mooi om de kop in twee regels te zetten, dat voorkomt een hoop herhalingen. Dan wordt het zoiets:

1. huidige kop

Jaar enkel NL

Aantal

NL & FR

Aantal

enkel FR

Aantal

FR & D

Aantal

enkel D

Aantal

D & NL

Aantal

NL & F & D

Aantal

Geen

Aantal

enkel NL

Aandeel

NL & FR

Aandeel

enkel FR

Aandeel

FR & D

Aandeel

enkel D

Aandeel

D & NL

Aandeel

NL& FR & D

Aandeel

Jaar NL

Aantal

FR

Aantal

D

Aantal

NL

Aandeel

FR

Aandeel

D

Aandeel

2. kop met talen in kleine letters en juiste spaties

Jaar enkel nl

Aantal

nl & fr

Aantal

enkel fr

Aantal

fr & de

Aantal

enkel de

Aantal

de & nl

Aantal

nl & fr & de

Aantal

Geen

Aantal

enkel nl

Aandeel

nl & fr

Aandeel

enkel fr

Aandeel

fr & de

Aandeel

enkel de

Aandeel

de & nl

Aandeel

nl & fr & de

Aandeel

Jaar nl

Aantal

fr

Aantal

de

Aantal

nl

Aandeel

fr

Aandeel

de

Aandeel

3. kop met talen in kleine letters en juiste spaties, splitsing tussen aantallen en aandeel

Aantal Aandeel
Jaar enkel nl nl & fr enkel fr fr & de enkel de de & nl nl & fr & de enkel andere enkel nl nl & fr enkel fr fr & de enkel de de & nl nl & fr & de
Aantal Aandeel
Jaar nl fr de nl fr de

4. kop met talen in kleine letters en juiste spaties, splitsing tussen aantallen en aandeel, hoofdlettervrij

aantal aandeel
jaar enkel nl nl & fr enkel fr fr & de enkel de de & nl nl & fr & de enkel andere enkel nl nl & fr enkel fr fr & de enkel de de & nl nl & fr & de
aantal aandeel
jaar nl fr de nl fr de
Heb jij voorkeur voor het tweede, derde of vierde voorstel?
Omdat het gestandaardiseerde koppen lijken, zou vervanging niet zo moeilijk mogen zijn. De pagina Talentelling heeft daarnaast nog een andere tabel onderaan, dit kopje zou ook mee moeten. Met vriendelijke groet, RonnieV (overleg) 23 jul 2021 01:22 (CEST)[reageer]
Bedankt voor de moeite! Mij lijkt nummer drie het mooiste, is wat overzichtelijker, ook omdat "Aandeel" en "Aantal" vrij veel op elkaar lijken, en het lijkt mij gebruikelijk om een hoofdletter te hebben als eerste letter voor een kolomtitel. Maar wat is de reden dat alle kolommen niet naast elkaar staan en in plaats daarvan in twee aparte tabellen staan? Ook lijkt het me logischer om om "nl & de" te zeggen, aangezien nl ook voor de staat in "nl & fr & de". Ennomien (overleg) 23 jul 2021 11:27 (CEST)[reageer]
Ik kan prima uit de voeten met voorstel 3 en de hoofdletters maken het misschien inderdaad nog wat duidelijker. Als je een alternatief weet voor 'Aandeel' ('Percentage'?) is dit het moment om dat mee te nemen.
Er staan op bijvoorbeeld deze plek twee tabellen per plaats. Ik heb voor beide tabellen de koppen meegenomen in het voorstel. De volgorde van de talen... We zijn de Nederlandstalige encyclopedie, dus valt er iets voor te zeggen om nl voorop te zetten. We zijn ook neutraal. Dat zou ervoor pleiten om (binnen de kopjes) de talen alfabetisch te ordenen, dus 'de & fr', 'de & nl', 'fr & nl', 'de & fr & nl'. Ik wil niet gaan rommelen met de volgorde van de kolommen in de tabellen. Met vriendelijke groet, RonnieV (overleg) 23 jul 2021 13:32 (CEST)[reageer]
Ik denk dat 'Aandeel' wel het beste is. En door, simpel gezegd, de colspan van 'Aandeel' en 'Aantal' te verbreden, is het naar mijn mening geen groot punt meer dat de woorden op elkaar lijken. Dit kan in de huidige situatie namelijk wat verwarring opleveren omdat de woorden zo vaak voorkomen.
Oh ja, dat was ik even vergeten. Duidelijk. Ik snap dat de volgorde van de kolommen het beste gelijk kan blijven en dan is de huidige naamgeving wel goed. Of wellicht op alfabetische volgorde, maar dat is mij eerlijk gezegd om het even. Ennomien (overleg) 23 jul 2021 14:27 (CEST)[reageer]
Beste @RonnieV:, ik wil niet opdringerig overkomen, maar wat is nu het plan? Of zie je niks in het uitvoeren van het verzoek? Excuses als ik bot overkom, zo is het niet bedoeld. Met vriendelijke groet, Ennomien (overleg) 30 jul 2021 09:24 (CEST)[reageer]
Beste @Ennomien:, bedankt voor je herinnering. Ik ben er vandaag maar even voor gaan zitten om een stukje code te schrijven. Daarmee kan ik deze wijziging vrij eenvoudig via mijn computer doen. Als je het hiermee eens bent, zal ik de andere pagina's uit de categorie ook doen. Het bedenken van het hoe het moest worden en hoe het uit te voeren was waarschijnlijk het grootste deel van het werk. Met vriendelijke groet, RonnieV (overleg) 30 jul 2021 17:13 (CEST)[reageer]
Heel erg bedankt, dat ziet er goed uit! Groeten Ennomien (overleg) 30 jul 2021 17:59 (CEST)[reageer]
Ik heb de volgorde van de talen nog alfabetisch gemaakt (in de kolomkopjes, niet de kolommen zelf herschikt) en een aan de pagina niet zichtbare fout verholpen (de kopjes stonden ergens in de code van de tabel, maar omdat ze buiten een cel stonden, werden ze toch voor de tabel getoond). Op naar de andere pagina's. Met vriendelijke groet, RonnieV (overleg) 30 jul 2021 21:21 (CEST)[reageer]
Helemaal prima, goed dat je dat ook gevonden hebt en meeneemt. Ben dankbaar dat je het verzoek hebt uitgevoerd. Ennomien (overleg) 30 jul 2021 22:28 (CEST)[reageer]
  1. "Prebivalstvo po starosti in spolu, občine, Slovenija, polletno". Statistični urad Republike Slovenije. Geraadpleegd op 18 april 2021.