Wikipedia:Botcafé/Archief/2009-04
Ontdubbelen van Lijst van -ismen
bewerkenIn de Lijst van -ismen staan enorm veel dubbelen en het is handmatig bijna niet te doen om ze er allemaal uit te halen. Voorbeelden:
- boeddhisme en buddhisme (zulke dubbelingen staan er heel veel in)
- absolutisme verwijst naar Absolute monarchie en in dat geval is de redirect niet dubbel.
Ik weet niet precies wat een bot allemaal kan, maar zou zoiets botmatig op te lossen zijn? Want op deze manier is de lijst oninteressant om door te kijken. Davin 5 apr 2009 18:18 (CEST)
- Dit zou zeker gemakkelijk met de bot op te lossen zijn (een bot kan van alle links op die pagina kijken of het een redirect is, en zo ja waarheen), maar ikzelf denk dat het beter zou zijn die lijst met de hand aan te pakken. Naar mijn mening is hij namelijk ook ná ontdubbeling nog weinig interessant. Om het echt interessant te maken zou er onderverdeeld moeten worden naar gebied (filosofische stromingen, kunststijlen, wetenschappelijke theorieën...) en de valse -ismen (aardmagnetisme, wijntoerisme...) verwijderd moeten worden. Maar ik heb toch maar even het door jou gevraagde onderzoek uitgevoerd, zie Gebruiker:Davin/ismen. - André Engels 6 apr 2009 11:21 (CEST)
- Het is misschien wat rigoureus, maar ik de versie van 3 jan 2008 01:08 teruggezet. Die was nog overzichtelijk en aantrekkelijk. Degene die al die dubbele ismes erbij heeft gezet is Proko en die is hier al een jaar niet meer. Naar mijn overtuiging is hij zo stukken opgeknapt. Geef gerust je mening... Davin 6 apr 2009 19:07 (CEST)
- Wel, mijn mening heb ik hierboven al weergegeven, al zijn alle onzin-ismen er nu inderdaad uit. Een nieuwe run van de door mij geschreven bot geeft aan dat er nog 1 dubbele term in zit (secessionisme naar separatisme), en 1 redirect naar een -isme niet op de lijst (zoroastrianisme naar zoroastrisme), alsmede 4 redirects naar niet-ismen (mormonisme, rastafarianisme, Rooms-katholicisme en zevendedagsadventisme). - André Engels 8 apr 2009 10:39 (CEST)
- Bedankt voor je botbewerking. Ik zal die laatste dingen nog even aanpassen. Davin 8 apr 2009 12:12 (CEST)
- Heel interessant om door te nemen is de lijst inderdaad niet. Op de overlegpagina heb ik een oproep geplaatst en wellicht dat een toevallige passant dat een keer wil oppakken. Davin 8 apr 2009 12:18 (CEST)
- Wel, mijn mening heb ik hierboven al weergegeven, al zijn alle onzin-ismen er nu inderdaad uit. Een nieuwe run van de door mij geschreven bot geeft aan dat er nog 1 dubbele term in zit (secessionisme naar separatisme), en 1 redirect naar een -isme niet op de lijst (zoroastrianisme naar zoroastrisme), alsmede 4 redirects naar niet-ismen (mormonisme, rastafarianisme, Rooms-katholicisme en zevendedagsadventisme). - André Engels 8 apr 2009 10:39 (CEST)
- Het is misschien wat rigoureus, maar ik de versie van 3 jan 2008 01:08 teruggezet. Die was nog overzichtelijk en aantrekkelijk. Degene die al die dubbele ismes erbij heeft gezet is Proko en die is hier al een jaar niet meer. Naar mijn overtuiging is hij zo stukken opgeknapt. Geef gerust je mening... Davin 6 apr 2009 19:07 (CEST)
Top 1000 van meest bekeken artikelen
bewerkenDe lijst Wikipedia:Top 1000 van meest bekeken artikelen begint inmiddels wat ouder te worden (januari 2007). Ik weet ook niet of WikiCharts nog werkt; de betreffende link daar in elk geval niet. Is het misschien met een bot mogelijk deze lijst te updaten naar de huidige stand van zaken, bij voorkeur met een sterretje erbij wanneer het artikel in de etalage staat? Davin 11 apr 2009 11:44 (CEST)
- Geen idee of hoe je een hele lijst maakt. Ik weet wel hoe je het pe artikel kan bekijken. Zo is hier te zien dat Saddam Hoessein nu al lang niet meer op de 2e plek staat (maar 1464e met zo'n 200-300 hits per dag), Magalhães 11 apr 2009 13:05 (CEST)
- Het vonnis op Saddam Hoessein werd op 30 december 2006 uitgevoerd en dan is het inderdaad logisch dat zijn artikel in januari 2007 veel gelezen is. Het tooltje van Henrik ken ik inderdaad ook. Deze lijst maakt echter gebruik van deze niet meer werkende link op de toolserver. Misschien dat iemand weet of die tool nog op een andere plaats bestaat? Davin 11 apr 2009 14:36 (CEST)
- Wat bedoel je met Henriks tooltje? Op stats.grok.se staat in ieder geval een lijst met meestbezochte pagina's. Deze data komt van de Wikimediaservers en staat los van de toolserver. --Erwin 11 apr 2009 15:03 (CEST)
- Die statistieken bedoelde ik inderdaad met Henrik's tooltje. Ik kende hem alleen op artikelniveau, maar er is dus ook een "top 1000" mee mogelijk, zie ik nu. Dit is op zich een goede vervanger van WikiCharts. Weet iemand of het mogelijk is een top 1000 van alleen de hoofdnaamruimte te krijgen? Want dan zijn we er bijna. Davin 11 apr 2009 16:12 (CEST)
- Hij geeft trouwens niet de statistieken van maart 2009, maar tot maart 2009. Bij Vertelperspectief (plaats 16) gaat dat bijvoorbeeld helemaal mis, omdat hij in augustus 2008 68.000 bezoekers heeft geteld. Zo'n foute telling blijft er dan vervolgens in staan. Davin 11 apr 2009 16:21 (CEST)
- Wat bedoel je met Henriks tooltje? Op stats.grok.se staat in ieder geval een lijst met meestbezochte pagina's. Deze data komt van de Wikimediaservers en staat los van de toolserver. --Erwin 11 apr 2009 15:03 (CEST)
- Het vonnis op Saddam Hoessein werd op 30 december 2006 uitgevoerd en dan is het inderdaad logisch dat zijn artikel in januari 2007 veel gelezen is. Het tooltje van Henrik ken ik inderdaad ook. Deze lijst maakt echter gebruik van deze niet meer werkende link op de toolserver. Misschien dat iemand weet of die tool nog op een andere plaats bestaat? Davin 11 apr 2009 14:36 (CEST)
Splitsing mailinglijsten
bewerkenTot voor kort was er één mailinglijst voor discussie over pywikipediabot: pywikipedia-l. Omdat op deze lijst veel automatische (svn en bugtracker) berichten langskwamen is besloten deze op te splitsen. Er zijn nu vier lijsten:
- pywikipedia-announce - belangrijke bugfixes (bijvoorbeeld als er een bug is die er voor zorgt dat bots vernielingen aanrichten)
- pywikipedia-l - discussies over het framework (zowel gebruik als ontwikkeling); berichten van de announce-lijst worden hier ook doorgestuurd.
- pywikipedia-svn - SVN-berichten
- pywikipedia-bugs - bugtracker-berichten
Het ontwikkelingsteam raadt aan om in ieder geval de berichten van pywikipedia-announce te ontvangen als je het pywikipediabot-framework gebruikt. Discussies vinden daar niet plaats, die zijn te voeren op pywikipedia-l. valhallasw 18 apr 2009 20:20 (CEST)
- Goed werk. --Erwin 18 apr 2009 21:59 (CEST)
Parameters worden genegeerd
bewerkenIk heb pywikipedia opnieuw geïnstalleerd, en het lijkt erop dat de parameters worden genegeerd.
replace.py -help Please enter the text that should be replaced:
solve_disambiguation.py "Lars Boom" On which disambiguation page do you want to work?
Wie weet wat dit kan veroorzaken? Larzzz 19 apr 2009 15:50 (CEST)
- Lees eerst eens even de handleiding. Op meta kan je een hoop vinden en in het begin van de bronbestanden. Multichill 19 apr 2009 19:06 (CEST)
- Dat heb ik uiteraard al gedaan, maar ik vind daar geen oplossing. Larzzz 19 apr 2009 19:42 (CEST)
- En als je expliciet python aanroept:
- python replace.py -help
- Misschien werkt dat wel. ∼ Wimmel 19 apr 2009 20:48 (CEST)
- Hm ja, dat werkt wel. Ik gebruik Windows Vista, en voorheen deed die het wel. Er zit dus ergens een instelling verkeerd. Ik heb de extensie .py wel automatisch gekoppeld aan python. Nu moet ik namelijk eerst naar de map waar python staat, en dan het volledige path van replace.py opgeven. Larzzz 19 apr 2009 21:22 (CEST)
- Of je gebruikt het volledige path naar python, zoiets als c:\python25\bin\python replace.py -help
- De koppeling van .py naar python is waarschijnlijk verkeerd. Die is denk ik python "%1", dit moet volgens mij python "%1" %* zijn. ∼ Wimmel 19 apr 2009 21:45 (CEST)
- Ja, je hebt gelijk. De koppeling stond inderdaad verkeerd. Bedankt Wimmel. Larzzz 19 apr 2009 22:37 (CEST)
- Hm ja, dat werkt wel. Ik gebruik Windows Vista, en voorheen deed die het wel. Er zit dus ergens een instelling verkeerd. Ik heb de extensie .py wel automatisch gekoppeld aan python. Nu moet ik namelijk eerst naar de map waar python staat, en dan het volledige path van replace.py opgeven. Larzzz 19 apr 2009 21:22 (CEST)
- En als je expliciet python aanroept:
- Dat heb ik uiteraard al gedaan, maar ik vind daar geen oplossing. Larzzz 19 apr 2009 19:42 (CEST)