Wikipedia:De kroeg/Archief/20221220

Gaat Internet Archive Bot hier niet buiten zijn boekje? bewerken

Ik zag zojuist [deze] ingreep van Internet Archive Bot in het artikel Alaküla (Märjamaa). Wat gebeurt hier?

  1. IAB vervangt een link naar Archive.today door een link naar de Wayback Machine.
  2. IAB vernietigt de link naar de oorspronkelijke webpagina door daar het label "unfit" op te plakken. De oorspronkelijke webpagina, een pagina in het Dictionary of Estonian Place names, werkt echter nog gewoon.

Ik vind dit wel heel ver gaan. Veel te ver eigenlijk. Sijtze Reurich (overleg) 12 nov 2022 22:01 (CET)[reageren]

Zie meta:User talk:InternetArchiveBot#archive.ph. Wikiwerner (overleg) 12 nov 2022 22:52 (CET)[reageren]
Wat zei InternetArchiveBot er zelf over? Misschien moeten op https://iabot.toolforge.org/index.php?page=reportfalsepositive de Estse pagina's die kennelijk helemaal niet onbereikbaar zijn als vals positief gemeld worden. Ik weet niet zeker of dat nodig is, want misschien ligt het aan het samenspel met archive.ph.
Ik vond de link die ik noemde via de gebruikerspagina van InternetArchiveBot. –Frank Geerlings (overleg) 12 nov 2022 23:00 (CET)[reageren]
Ik loop vast bij een poging om daar in te loggen. Maar ik heb niet de indruk dat IAB de pagina's van het Dictionary of Estonian Place names als dood ziet. Ik denk dat IAB zo geprogrammeerd is dat hij 1. links naar Archive.today automatisch vervangt door links naar de Wayback Machine. Daar ben ik het al niet mee eens, want de ene is niet beter dan de andere; 2. daarna automatisch de link naar de oorspronkelijke pagina vernietigt, ongeacht of die pagina wel of niet bereikbaar is. Daarmee treedt IAB buiten zijn bevoegdheden. Sijtze Reurich (overleg) 13 nov 2022 02:57 (CET)[reageren]
Dat laatste lijkt me inderdaad onwenselijk, maar de vervanging van Archive.today-links door links naar de Wayback Machine is misschien zo gek nog niet. De Wayback Machine is inmiddels een gerespecteerd instituut, en waarschijnlijk een blijvertje, terwijl op Archive.today helemaal niets te vinden is over de organisatie achter deze archiefdienst. Onze collega's ten oosten van Bad Nieuweschans schrijven: "Die Betreiber des Dienstes wollen anonym bleiben und veröffentlichen weder Impressum noch andere Daten zu ihrer Identität. Nach eigener Aussage aus dem Jahr 2013 waren sie damals ein kleines Team, bestehend aus einigen wenigen Personen." De overlevingskansen van Archive.today op langere termijn lijken me dus een stuk kleiner. — Matroos Vos (overleg) 14 nov 2022 15:37 (CET)[reageren]
Archive.today was bij mijn weten oorspronkelijk een Israëlische website in het .is-domein. Om een of andere reden zijn ze diverse malen van domein gewisseld. De dienst kan bepaalde websites archiveren waar archive.org op vastloopt. Die laatste heeft onmiskenbaar het voordeel van een herkenbare URL, waar de eerste gewoonlijk een verkorte URL gebruikt.
Het blijft raadselachtig waarom iemand zo'n archief wil opzetten en hoe dit te financieren. Dat geldt voor beide. Wickey (overleg) 14 nov 2022 17:31 (CET)[reageren]
Hoe kom je erbij dat het Israëlisch zou zijn? .is is IJslands. –bdijkstra (overleg) 14 nov 2022 17:42 (CET)[reageren]
@Wickey: Dat geldt natuurlijk ook voor ons. Wikiwerner (overleg) 14 nov 2022 18:46 (CET)[reageren]
Archive.org is onderdeel van een non-profit, Internet Archive, die gefinancierd wordt door donaties en is ooit opgezet door Brewster Kahle. Dat is vrij goed gedocumenteerd. Ik ben zelf wel blij dat er meer diensten zijn die dergelijke activiteiten ontplooien, want dat maakt de maatschappij minder afhankelijk van een enkele aanbieder. Zelf heb ik me wel altijd wat achter de oren gekrabt vanwege de geheimzinnigheid van archive.is en de zusjes. en:Archive.today bevat wel wat meer informatie, maar eigenlijk ook helemaal niets over wie erachter zit. Ik kan me dus goed inleven in de redenering van Matroos Vos. -- Effeietsanders (overleg) 14 nov 2022 19:02 (CET)[reageren]
Ik heb ook een vraag bij Internet Archive Bot neergelegd (hier) over waarom hij een werkende link van archive.today omzet naar Internet Archive. Ymnes (overleg) 18 nov 2022 09:32 (CET)[reageren]
Ik kwam dit tegen. Een normaal werkende link naar de website van een centrale bank wordt vervangen door een 13 jaar oude zeer trage kopie.  LeeGer  18 nov 2022 09:38 (CET)[reageren]
Goed punt dat de link zelfs langzamer is. Ik heb dat in mijn reactie aan de botoperator aangevuld. Ymnes (overleg) 18 nov 2022 10:02 (CET)[reageren]
Een voorbeeld van een website waar het Internet Archive zich geen raad mee weet is deze. Het Internet Archive maakt er dit van. Archive.today geeft dit resultaat. Daarom heb ik in het artikel Pärna (Hiiumaa) bewust een link naar Archive.today opgenomen. Het lijkt me zeer onwenselijk als IAB die link gaat vervangen. Sijtze Reurich (overleg) 22 nov 2022 18:27 (CET)[reageren]
Op de pagina waar Ymnes naar linkt lees ik dat je niet de korte archive.today/archive.ph-links moet gebruiken, maar de lange. Gaat het dan beter? Dat zou mooi zijn, want de lange archive.today-links zijn toekomstbestendiger, ook dat heb ik daar gelezen. Ook al is enwiki niet nlwiki, er worden enkele goede argumenten genoemd (in en:Help talk:Using archive.today#RfC: Should we use short or long format URLs? via phab:320969).
Dit is een workaround, en eigenlijk moet die bot natuurlijk gefixt worden, maar ik hoop dat dit helpt. –Frank Geerlings (overleg) 24 nov 2022 00:32 (CET)[reageren]
Ik wil best de lange links gebruiken, maar waar vind ik die? Volgens mij zijn er best wel dingen waar ik goed in ben, maar technisch inzicht maakt daarvan geen deel uit. Sijtze Reurich (overleg) 24 nov 2022 09:31 (CET)[reageren]
Klik op de link 'share' bovenaan zo'n archiefpagina. Dat ontdekken heeft weinig met technisch inzicht te maken, meer met nieuwsgierigheid, denk ik. –bdijkstra (overleg) 24 nov 2022 09:44 (CET)[reageren]
Hartelijk dank! Het werkt. Sijtze Reurich (overleg) 24 nov 2022 10:05 (CET)[reageren]
Toevallig haalt IAB zojuist hetzelfde trucje uit op het artikel Haavakivi. Archiefversie van Archive.today vervangen door de veruit inferieure versie van het Internet Archive, die bovendien tergend langzaam laadt – en hup, meteen de link naar de oorspronkelijke pagina, die gewoon werkt, onbereikbaar maken. Ik heb de bewerking teruggedraaid. Sijtze Reurich (overleg) 24 nov 2022 16:11 (CET)[reageren]
Vervangen van de korte link naar Archive.today door een lange link helpt niet. Zie de bewerking van IAB op Kirumpää. Ik heb op Regblok een blokkade voor IAB aangevraagd. Sijtze Reurich (overleg) 29 nov 2022 01:24 (CET)[reageren]
Uit de voorbeelden die Sijtze hierboven geeft, blijkt dat de kopieën op Archive.today regelmatig beter zijn dan die in het Internet Archive. Tegelijkertijd blijft Archive.today een wat schimmige organisatie die waarschijnlijk slechts uit een paar personen bestaat en daardoor waarschijnlijk ook veel minder toekomstbestendig is dan het Internet Archive. Het zou dus eigenlijk het mooist zijn als de InternetArchiveBot een dode link vervangt door een link naar beide archieven, zodat we in één klap the best of both worlds krijgen. Is er iemand met de nodige bot-kennis die weet of dat eenvoudig te realiseren is? — Matroos Vos (overleg) 6 dec 2022 04:18 (CET)[reageren]
Degene die InternetArchiveBot onderhoudt zal dat moeten doen. Ik denk niet dat wij dat eenvoudig kunnen realiseren. –Frank Geerlings (overleg) 11 dec 2022 17:57 (CET)[reageren]

NOS.nl bewerken

Bij [1] verwijderd de bot links naar NOS.nl. Die zijn inderdaad verdwenen, maar zijn de gegevens dan gebleven? Of worden de NOS links niet gearchiveerd?Smiley.toerist (overleg) 12 dec 2022 13:51 (CET)[reageren]

In die bewerking wordt een CNN-referentie zonder meer verwijderd, onduidelijk waarom.
De NOS-links waren ondeugdelijk, zie:

Dat was niet moeilijk te vinden, gewoon de titel googelen  →bertux 12 dec 2022 15:11 (CET)[reageren]
Oh, die CNN-ref was een doublure van een andere →bertux 12 dec 2022 15:35 (CET)[reageren]

De twee links heb ik hersteld. Ik ben wel in verwarring met de datum laatste keer bezocht. Die heb ik bij de eerste link vandaag gezet op 13 december 2022, maar de belangrijkere publicatiedatum is 4 mei 2022. Bij de tweede link heb ik de datum ongemoeid gelaten. Is er niet een aparte publicatiedatum?Smiley.toerist (overleg) 13 dec 2022 11:25 (CET)[reageren]

In dit soort gevallen ga ik niet de oude ref wijzigen, maar laat ik de visuele editor een nieuwe maken. Dan wordt dat allemaal voor je ingevuld, inderdaad met de correcte datum 4 mei. Als je het toch met de hand wilt doen: de parameter voor 'publicatiedatum' is gewoon datum; in te vullen als 2022-05-04 (ter wille van automatische verwerking) en op nlwiki weergegeven als 4 mei 2022 (ter wille van de mens). Bij de nadere is het 14 maart  →bertux 13 dec 2022 11:51 (CET)[reageren]

Tech News: 2022-46 bewerken

MediaWiki message delivery 14 nov 2022 22:54 (CET)[reageren]