Wikipedia:Botcafé/Archief/2011-09

Redirects voor ALLE pagina's met diakrieten in de titel. bewerken

Alvorens het gewoon terloops te verzoeken, eerst even peilen bij de mensen met de botbitjes (het is nogal een operatie namelijk). Zou het 1) mogelijk en 2) wenselijk zijn om alle pagina's met diakrieten in de titel (grotendeels bot-aangemaakte buitenlandse dorpen) te voorzien van een redirect zonder diakrieten? Een paar keer klikken op willekeurig artikel gaf mij al snel Mołtowo, een dorp in Polen. Een bot zou dan het artikel Moltowo moeten maken met de volgende inhoud:

#REDIRECT [[Mołtowo]]
{{R diakrieten}}

Alle instanties waarbij de versie zonder diakrieten al bestaat (en niet de reeds aangemaakte gewenste redirect is) zouden handmatig bekeken moeten worden of er bijvoorbeeld een dvp gewenst is. Wat vinden jullie van dit idee? Kan iemand mij vertellen hoeveel artikelen er een diakritisch teken in de naam hebben staan? Om een idee te krijgen van de schaal van dit verzoek. - Kafir (overleg) 21 sep 2011 02:07 (CEST)[reageer]

  • Voor, al helemaal voor de mobiele gebruikers die waaroor het praktisch onmogelijk is rare tekentjes in te toetsen. 7bits/US-ASCII FTW! Milliped (overleg) 21 sep 2011 16:21 (CEST)[reageer]
    • Ik vind dit absoluut geen slecht idee. Ik zie dat Halandinh bezig is met talloze plaatsen in Vietnam te beschrijven, maar die bezitten in hun naam allelei diakritische tekens. Het zou zeer leuk zijn mocht iemand met de nodige technische kennis hiervoor een programma schrijven dat permanent of met enige regelmaat kan lopen om deze redirects in te voeren. - C (o) 21 sep 2011 16:55 (CEST)[reageer]
Ja, wel een goed idee. Je hebt dan even een probleem als de pagina zonder diakriet al bestaat met een andere betekenis. Je moet dan waarschijnlijk een dp maken en dat is handwerk.
Milliped heeft overigens ongelijk: als je de naam zonder diakrieten in het zoekveld tikt, krijg je de diakrieten er vanzelf bij. Handige Harrie (overleg) 21 sep 2011 17:10 (CEST)[reageer]
Als ik in het zoekveld Moltowo invul, staat Moltowo met het diakriet er niet bij..... Goudsbloem (overleg) 21 sep 2011 17:40 (CEST)[reageer]
Goed, ik corrigeer mezelf een beetje. Kennelijk werkt het bij de Poolse ł niet. Milliped heeft dus een beetje ongelijk. Handige Harrie (overleg) 21 sep 2011 17:49 (CEST)[reageer]
Ik ben wel voor, maar het moet wel breed worden geaccepteerd. Er worden nogal eens doorverwijzingen voor nuweg aangedragen, dan moeten we ze niet aan de andere kant met een bot toevoegen. Maar in principe zullen gebruikers er niets van merken, want deze pagina's komen nergens in de statistieken tevoorschijn, bij mijn weten. edOverleg 21 sep 2011 19:02 (CEST)[reageer]
Het lijkt me prima die redirects te hebben. Wat ik me wel afvraag is wat het nut is om aan die redirectpagina's {{R diakrieten}} toe te voegen? Ik begrijp dat dat sjabloon een categorie toevoegd, maar wat is het nut van die categorie? Romaine (overleg) 21 sep 2011 19:10 (CEST)[reageer]
Denken jullie dat het handig is om eerst een peiling op te zetten? Het zou niet mijn eerste peiling zijn vandaag :-). Het idee van {{R diakrieten}} is in principe dat iedereen ziet waarom die redirect er is er ook waarom die handig is. Het zou wel meteen het meest gebruikte sjabloon van nl-wiki worden. - Kafir (overleg) 21 sep 2011 19:22 (CEST)[reageer]
Ik ben erg voor, geen grote nadelen, en ontzettend veel voordelen, niet alleen voor Vietnameze plaatsen, maar bijvoorbeeld ook voor bekende plaatsen in Frankrijk (ik wilde Orléans noemen, maar die telt net niet mee) is dit zeer nuttig. Ik kan me voorstellen dat ter diakrieten zijn zoals å, þ, of minder bekende, waarbij het even puzzelen is om een Nederlands equivalent te vinden. Vervang je å door a of door aa, en þ en ð door t, d, of th? Misschien moeten we daar dan even een lijstje voor opstellen. Of vallen deze letters niet onder dit voorstel?
Thijs! (overleg) 21 sep 2011 20:15 (CEST)[reageer]

Ook zou, indien dit doorgevoerd gaat worden, meegenomen moeten worden de artikelnamen met meerdere diakrieten om die met meerdere redirects te bedienen. Sommige mensen weten bijvoorbeeld wel het ene diakriet in een naam maar niet het andere. Voorbeeld: Long Điền zou als redirects moeten hebben Long Dien, Long Diền en Long Đien en bijvoorbeeld Đất Đỏ zou als redirects moeten hebben Dat Do, Dat Dỏ, Dat Đo, Dất Do, Đat Do, Đat Dỏ, Đat Đo, Đất Do, Dất Dỏ, Dat Đỏ, en Dất Đo. Volgen jullie mij nog of wordt het nu te ingewikkeld?   Tevens zou er bij die foutieve (!) redirects een onzichtbare categorie toegevoegd behoren te worden, zodat de foutieve benamingen ook door bijvoorbeeld een bot opgelost kunnen worden, zodat de fouten ook uit de encyclopedie gehaald kunnen worden en niet door middel van redirects blijven bestaan. Goudsbloem (overleg) 21 sep 2011 23:50 (CEST)[reageer]

Dat maakt het wel heel complex, en ik denk dat de groep die je hiermee bedient erg klein is. Ik zou het houden bij de 26 letters in ons alfabet, zonder een enkele diakriet. Het lijkt me sterk dat iemand de wel kan maken en de niet. Je laatste idee klinkt erg goed! Als iemand zo'n bot kan programmeren, is dat een inhoudelijke verbetering van de encyclopedie. Thijs! (overleg) 22 sep 2011 00:00 (CEST)[reageer]
O, ik wil 't wel doen hoor. Dan moet je me even deblokkeren. Handige Harrie (overleg) 22 sep 2011 00:04 (CEST)[reageer]
;-) Zodra het overleg-stadium geweest is, en de bot gemaakt zou kunnen worden, dan wil ik wel een deblokkadeverzoek indienen. Maar als ik dat nu doe, weet jij en ik de uitslag toch al. edOverleg 22 sep 2011 09:29 (CEST)[reageer]
Ik denk dat je je moet beperken tot ontdiakrieten, zoals Thijs! hierboven al voorstelt, en dan alleen voorzover de interne zoekfunctie en/of die van Google bij het intypen van de naam als platte ASCII geen resultaten geeft.
Er zijn bovenop de 750k pagina's met meer of minder tekst, al 325k redirects. Ook redirects voor hoofd- kleine letters, zoals ik vaak voorbij zie komen, zijn m.i. totaal overbodig. - RonaldB (overleg) 22 sep 2011 00:19 (CEST)[reageer]
Redirects voor kapitalen en onderkast zijn niet geheel overbodig. In het zoekvenster maakt het niks uit als je kapitalen of onderkast gebruikt, dan kom je toch op de goede pagina terecht. Maar als iemand in een artikel een link zet naar bijvoorbeeld Another One Bites The Dust of Another one bites the dust, is het wél van belang dat die redirect er is, anders worden die linken rood... En natuurlijk waren die vele redirects die naar één artikel kunnen leiden wat ik hierboven uitlegde een beetje in het absurde doorgetrokken, maar het toont maar aan hoe ingewikkeld deze kwestie nog wel is. En wat Thijs hierboven meldde dat indien men het ene diakriet niet kan toetsen dat men dan waarschijnlijk het andere ook niet kan intypen, gaat niet geheel op, want ik weet redelijk veel diakrieten op mijn toetsenbord te vinden door middel van toetsencombinaties (ik zet dan ook redelijk wat stukken tekst in buitenlandse talen voor mijn werk), maar niet alle, dus zou ik zomaar een gedeelte wél intoetsen en een gedeelte niet van een artikelnaam. Goudsbloem (overleg) 22 sep 2011 11:07 (CEST)[reageer]
Probleem is ook dat dit niet 123 met een bot te doen is. Er zijn ook vele 'dubbel'gevallen als bijvoorbeeld Långholmen en Längholmen. Waar moet dan de redirect Langholmen naar verwijzen? Dat zou dan een dp moeten worden lijkt mij. Dus met een bot zou het zeer lastig zijn, het zal altijd semi-automatisch moeten gebeuren lijkt mij. Goudsbloem (overleg) 22 sep 2011 13:24 (CEST)[reageer]
Een beetje bot kan de simpele gevallen wel oplossen, en tegelijkertijd een lijstje genereren van probleemgevallen. Daar zou dan handmatig (of botmatig, maar dat wordt waarschijnlijk niet in dank afgenomen, dus daar begin ik niet aan) een dp voor kunnen worden aangemaakt. Thijs! (overleg) 22 sep 2011 13:40 (CEST)[reageer]
Als van die probleemgevallen een lijst gemaakt wordt, wil ik zeker wel handmatig helpen om van de betreffende gevallen een dp te maken. Goudsbloem (overleg) 22 sep 2011 13:45 (CEST)[reageer]
Mijn idee is: de bot wil een redirect maken van Langholmen naar Långholmen. Lukt dat, dan is dat mooi. Blijkt dat de pagina al bestaat, dan trekt de bot aan de bel. Het maakt even niet uit wat de reeds bestaande pagina is, het is een redirect naar Längholmen (die misschien eerder door dezelfde bot is gemaakt) maar kan ook iets anders zijn.
Is de reeds bestaande pagina een redirect (of een dp), dan is het zeer wel mogelijk dat de bot er een dp (of een uitgebreidere dp) van maakt, maar ik weet niet of het de moeite waard is dat botmatig te doen. Handige Harrie (overleg) 22 sep 2011 14:13 (CEST)[reageer]
Botmatig aanmaken van dp's is in het recente verleden misgegaan (daar weet Thijs meer van 😉), dus zal het aanmaken van dp's handmatig (of semi-automatisch) moeten gebeuren. Goudsbloem (overleg) 22 sep 2011 14:44 (CEST)[reageer]
Misschien dat eerst maar eens (botmatig) moet worden geïnventariseerd 1) hoeveel pagina's er zijn met diakritische tekens 2) hoeveel mogelijke redirects er zijn als je de varianten van Goudsbloem meerekent en 3) hoeveel van die mogelijke redirects al "bezet" zijn en hoeveel probleemgevallen er dus zijn. Als dat er maar honderd zijn ofzo, dan kan het makkelijk handmatig gebeuren natuurlijk. - Kafir (overleg) 22 sep 2011 15:17 (CEST)[reageer]
Veel meer, dat staat vast. Inmiddels zie ik nog een probleem, en wel bij Lào Cai. Dat is een dp naar Lào Cai (provincie) en Lào Cai (stad). De bot moet nu een redirect maken van Lao Cai naar Lào Cai en niet van Lao Cai (provincie) naar Lào Cai (provincie). Handige Harrie (overleg) 22 sep 2011 16:42 (CEST)[reageer]
Waarom zou een bot geen redirect van Lao Cai (provincie) naar Lào Cai (provincie) mogen maken? - Kafir (overleg) 22 sep 2011 17:02 (CEST)[reageer]
Niemand tikt iets met haakjes in het zoekvak. Een redirect die ...(...) heet is nooit goed. Je tikt Lao Cai in het zoekvak en je komt dan op Lào Cai, waar je verder kunt kiezen. Handige Harrie (overleg) 22 sep 2011 17:04 (CEST)[reageer]
Ik kijk nog eens naar wat Goudsbloem zei om 13:24. Långholmen en Längholmen zijn allebei een dp. Langholmen wordt dan een dp naar twee dp's. Dat kan, maar ik weet niet of we dat willen. Je kunt ook de inhoud van Långholmen en Längholmen samenvoegen op Langholmen. Handige Harrie (overleg) 22 sep 2011 17:15 (CEST)[reageer]
In zo'n geval is het het beste om de volledige inhoud van de twee op die ene dp neer te zetten, want alleen een dp die naar twee andere dp's verwijst is zeker ongewenst. Goudsbloem (overleg) 22 sep 2011 20:08 (CEST)[reageer]
Ik zou het niet ongewenst willen noemen, het is best te verdedigen. Maar volgens jou valt Låängholmen dus buiten het onderwerp van deze discussie. Handige Harrie (overleg) 22 sep 2011 21:14 (CEST)[reageer]
Het valt wél in deze discussie, want zijn pagina's met een diakriet die geen diakriet-loze redirect hebben. Maar het zijn van die uitzonderingsgevallen waar apart naar gekeken dient te worden, en het zijn zeker niet de enige, zo zullen er vele artikelen zijn waar op de een of andere manier een moeilijkheid mee zal zijn. Daarom zal het niet meevallen om dit proces geheel botmatig te laten verlopen. Goudsbloem (overleg) 22 sep 2011 21:51 (CEST)[reageer]
Een nadeel van het creëren van al deze redirects is dat het dan heel verleidelijk wordt om alle links in je artikel lekker makkelijk zonder diakrieten te schrijven. De lezer komt toch wel op de juiste pagina uit. Bij het controleren van nieuwe pagina's kom ik net Moordvrouw tegen, met een link naar Thijs Romer, waar natuurlijk Thijs Römer bedoeld was. Zolang niet al die platte namen bestaan is er voor de auteur nog een reden de rode link op te lossen door de juiste schrijfwijze toe te passen.
Eigenlijk hebben we natuurlijk twee soorten redirects nodig: zoek-redirects om lezers op de juiste pagina te laten uitkomen (zoals Thijs Romer/Thijs Römer), en synoniem-redirects voor alternatieve schrijfwijzen van hetzelfde onderwerp (bijvoorbeeld Den Haag/'s-Gravenhage). Zoek-redirects zijn wat mij betreft ongewenst in artikelen, synoniem-redirects niet.
Het opnemen van alle platte redirects in een speciale categorie biedt dan natuurlijk wel weer de mogelijkheid om botmatig de links te corrigeren. Als ik dan toch Thijs Romer in mijn artikel opneem, dan kan een bot dat weer fixen. Met vriendelijke groet, Den Hieperboree (overleg) 24 sep 2011 23:53 (CEST).[reageer]
Als ik geen fouten heb gemaakt zijn er zo'n 87.000 titels met een diakriet (maar dat is een beetje afhankelijk van wat je als een diakriet opvat). Als we Goudsbloems systeem zouden volgen moeten er zo'n 150.000 redirects aangemaakt worden. MrBlueSky (overleg) 25 sep 2011 01:38 (CEST)[reageer]
En hoeveel daarvan leveren problemen op zoals met Langholmen (meerdere pagina's die zonder diakrieten hetzelfde worden). - Kafir (overleg) 25 sep 2011 12:46 (CEST)[reageer]
Dat zijn er zo'n 1.500. Daarnaast zijn er nog zo'n 1.300 gevallen waarbij er al een pagina staat onder de titel zonder diakrieten (veel hiervan zullen mogelijk dp's zijn) en 10.000 gevallen waarbij de titel zonder diakrieten al een redirect is (het merendeel hiervan zal al een redirect zijn naar (een van) de titel(s) met diakrieten). Er zullen dus toch enkele duizenden gevallen handmatig 'bekeken' moeten worden. Maar dat hoeft geen reden te zijn om de gevallen die automatisch kunnen niet alvast te doen. MrBlueSky (overleg) 26 sep 2011 01:02 (CEST)[reageer]
Dankjewel voor deze informatie, ik zal deze informatie snel in de poll zetten. 1500 problemen oplossen lijkt me nog net wel handmatig te doen met een handjevol mensen mocht de peiling positief uitkomen. - Kafir (overleg) 26 sep 2011 01:34 (CEST)[reageer]
Problemen? Welnee, dan maak je gewoon een redirect. En er zijn genoeg bots die verwijzingen naar redirects eruit pikken, zodat het bovengenoemde Thijs Romer-probleem meteen opgelost is.
En als het weglaten van de diakriet geen dubbelzinnigheid oplevert? Daar valt ook wel een bot voor te maken. Een redirect van Thijs Romer naar Thijs Römer is botmatig best te onderscheiden van een redirect van Den Haag naar 's-Gravenhage. Handige Harrie (overleg) 25 sep 2011 12:53 (CEST)[reageer]
@Handige Harrie: Als er genoeg bots zijn die verwijzingen naar redirects eruit pikken, waarom hebben we er dan nog zoveel? En hoe zou een bot een Thijs Romer-redirect kunnen onderscheiden van een 's-Gravenhage-redirect? Den Hieperboree (overleg) 25 sep 2011 22:32 (CEST).[reageer]
Omdat het niet toegestaan is op de Nederlandse wikipedia botmatig redirects op te lossen. Voor redirects in de diakrietencategorie zou daarvoor een uitzondering gemaakt moeten kunnen worden. Thijs! (overleg) 25 sep 2011 23:13 (CEST)[reageer]
@Thijs!: als ze in een aparte categorie zitten is het natuurlijk geen probleem. Maar Handige Harrie schreef En er zijn genoeg bots die verwijzingen naar redirects eruit pikken, en daarmee leek hij te stellen dat dergelijke bots nu al actief zijn...
Wikipedia:Redirect#Link naar redirect (wel/niet) repareren stelt dat het verhelpen van redirects slechts in bijzondere gevallen zinvol is. Maar als er met het corrigeren van de link naar een redirct een spelfout wordt opgelost (bijvoorbeeld door het juist vermelden van de diakrieten) kan daar natuurlijk geen bezwaar tegen zijn. Den Hieperboree (overleg) 25 sep 2011 23:31 (CEST).[reageer]
Ik denk dat vooral wordt gedoeld op 'verbeteringen' zoals [[Thijs Romer]] vervangen door [[Thijs Römer|Thijs Romer]]. Dat is weinig zinvol. Spelfouten verbeteren daarentegen is altijd goed (behalve op plekken waar deze bewust zijn aangebracht, zoals citaten en een uitleg over spelfouten, natuurlijk) – De voorgaande bijdrage werd geplaatst door Thijs! (overleg · bijdragen)
Of botsgewijze verbeteringen van redirects wenselijk zijn valt wat mij betreft buiten dit onderwerp, ik stel voor dat mensen dat ergens anders bespreken. Het gaat er mij als opener van het onderwerp puur over of het gewenst is dat er redirects bestaan voor elk artikel met diakritische tekens. Aangezien er dan tussen de 80.000 en 150.000 redirects aangemaakt zouden moeten worden, lijkt het me wenselijk om hierover eerst een peiling te houden. Een informeel middel dat toch een duidelijk signaal kan uitzenden. Die peiling zal ik wel aanmaken. - Kafir (overleg) 26 sep 2011 00:04 (CEST)[reageer]

Peiling bewerken

Zoals duidelijk gemaakt hierboven, ben ik een peiling in het WP:Opinielokaal gestart. Iedereen wordt aangeraden te stemmen. - Kafir (overleg) 26 sep 2011 00:10 (CEST)[reageer]

De peiling heeft een duidelijk positief resultaat opgeleverd. Een project wordt gestart op Wikipedia:Wikiproject/Redirects. - Kafir (overleg) 3 okt 2011 03:28 (CEST)[reageer]
Mooi! Ik heb de peiling niet in de peiling gehad; anders had ik ook voorgestemd - Quistnix (overleg) 3 okt 2011 14:03 (CEST)[reageer]