Overleg Wikipedia:Transliteratie- en transcriptiegids/Hindi en Urdu

Voorstel voor transliteratie uit Hindi, Urdu en verwante talen (Baluchi, Sindhi, Punjabi, Nepali, Bengali) bewerken

Ik doe hieronder een viertal voorstellen voor transliteratie uit deze talen op de Nederlandse wikipedia. Ik zal dat via een aantal punten doen, dan kan commentaar per punt behandeld worden.

1 Engelse transliteratie van de schriften bewerken

We gebruiken voortaan altijd en consequent de Engelse transliteratie. Engels is in India een officiële taal, in de andere betreffende landen vaak naast de lokale naam op borden gebruikt.

2 Uitzonderingen bewerken

De taalunie schrijft voor geografische namen een aantal uitzonderingen voor, te weten hier: [1] en hier [2] (bij de andere landen komen geen uitzonderingen voor). Om de transliteratie consequent te houden zou ik willen voorstellen dat we de uitzonderingen van deze lijst alléén over nemen als de versie van de taalunie in fonetisch Nederlands anders is dan de engelse spelling in fonetisch engels. D.w.z. Andamanen, Oost-Ghats en Bengalen, maar Kashmir en Hyderabad. De gedachte daarachter is dat we dan vanuit de betreffende talen consequent translitereren (wat de taalunie helaas niet doet), zodat de uitspraak per transliteratie gelijk blijft. Bovendien blijkt uit google dat in deze gevallen (in totaal zes) de engelse versie veel vaker voorkomt in het Nederlands (Kasjmir vs Kashmir 57.000 vs 223.000; Haiderabad vs Hyderabad 300 vs 45.000; Dekan vs Deccan 3.000 vs 9.000; Beloetsjistan vs Baluchistan 700 vs 17.000; Hindoekoesj vs Hindu Kush 250 vs 9.500; Pesjawar vs Peshawar 400 vs 22.500).

2a bewerken

Punt 2 betekent ook dat we in het geval de taalunie kiest voor oudere (engelse, zo je wil koloniale) spellingen, die niet door de Indiase overheid gebruikt worden (dat zijn: Benares ipv Varanasi; Bombay ipv Mumbai; Calcutta ipv Kolkata; Poona ipv Pune), dit advies volgen. Als de taalunie deze namen t.z.t. uit de lijst zou schrappen, zullen we ze daarin ook volgen.

2b bewerken

Als de Engelse naam van een artikel een Engels woord bevat (bijvoorbeeld "Taklang Pass"), vertalen we dat niet naar het Nederlands maar gebruiken de inheemse variant ("Taglang La" in dit geval). Tenzij de naam in de lijst van de Taalunie voorkomt.

3 Maatstaf voor Engelse spelling bewerken

De Engelse transliteratie kan op het Indiaas subcontinent onduidelijk gedefinieerd zijn, omdat soms vele spellingen (in het Romaanse schrift) voor namen en plaatsen naast elkaar bestaan. We hebben dus een maatstaf voor de Engelse spelling nodig. Ik stel voor de engelse wikipedia daarvoor te gebruiken, omdat deze een enorme (niet in te halen) hoeveelheid artikelen over het subcontinent heeft, vaak door bewoners van het subcontinent geschreven. Dat geeft problemen wanneer de engelse wikipedia haar spelling zou aanpassen, maar dit kiezen als maatstaf laat ook zien dat we vertrouwen in het project wikipedia hebben.

4 uitbreiden gebruik bewerken

Eventueel kunnen bovenstaande regels ook worden toegepast op de Zuid-Indiase talen (Chennai en Trivandrum zijn daar bv. nog twijfelgevallen), dus mijn vierde voorstel is voorstellen 1, 2, en 3 ook voor Zuid-India en Sri Lanka te laten gelden.

NB bewerken

Mijn voorstel is zeker niet perfect te noemen, omdat een perfecte transliteratie uit het door de betreffende taal gebruikte schrift (zoals, heel mooi, bij het Russisch gebeurt) dichter bij de orginele fonetiek zou liggen. Dat zou dingen geven als Djalallabad ipv Jallalabad; Tsjennai ipv Chennai. Maar omdat het engels vaak naast de eigen taal op het Indiaas subcontinent veel gebruikt wordt (in India zelfs officiele taal is), en het daarom tegenwoordig en in de toekomst waarschijnlijk door reisbureaux e.d. wordt gebruikt, lijkt me dat we voor deze transliteratie moeten kiezen.

Ook weet ik dat google geen geschikte maatstaf is voor het aannemen dat één spelling vaker voorkomt dan een andere. De getallen hierboven zijn echter zo duidelijk, dat ik denk dat ze in dit geval wel als maatstaf gebruikt kunnen worden om in die specifieke gevallen het advies van de taalunie niet op te volgen.

(was ondertekend: Woudloper 18 jul 2006 18:25 (CEST))Reageren

Commentaar bewerken

Ik denk dat het voorstel, althans het deel waar ik in mee zou gaan, als volgt is samen te vatten: pas bij Hindi en nauw verwante talen de weergave toe zoals dat in het Engels gebruikelijk is, met de Engelse WP als richtlijn. Dat lijkt mij een werkbare richtlijn die, voorzover ik dat kan beoordelen, aansluit bij wat in het Nederlandse taalgebied gebruikelijk is. Het hele punt 2 lijkt me daarbij overbodig. Dat punt betreft ook geen translitteratie, maar het al dan niet gebruiken van een vernederlandste geografische naam. Dat is een onderwerp op zich. Toch ook daarop een reactie: toepassing van zo'n uitzondering zou ook Tokio en Peking op losse schroeven zetten. Ik weet niet waarom juist die handvol namen uit India en Pakistan hier een uitzondering zouden moeten zijn op de Taalunie-afspraak en zou er dus niet aan beginnen. Punt 2b doet in het kader van translitteratie evenmin ter zake: de vraag is hier niet of het woord la al dan niet moet worden vertaald (in pas of in pass), maar of het eruit moet zien als la of als iets anders.

Overigens heb ik nog een vraag die ik als niet-kenner van Hindi en Urdu niet met zekerheid kan beantwoorden, namelijk of de woordbeelden zoals we die kennen (Chennai, Jalalabad) überhaupt wel translitteraties uit het Hindi en Urdu zijn, of gewoon ontleningen uit het Engels. Als het alleen om plaatsnamen gaat (en dat gebeurt hierboven, terwijl een translitteratievoorstel over al het Hindi en Urdu zou moeten gaan), zou de afspraak ook veel eenvoudiger kunnen zijn: gebruik de Engelse plaatsnamen, tenzij Taalunieversum een Nederlandse opgeeft. Omdat Engels ter plaatse immers een officiële taal is.

Dat daar sprake van is (dus niet van Hindi en Urdu, maar van Engels), doet de Engelse WP vermoeden. Die zegt immers voor de translitteratie van het Devanāgarī-alfabet het IAST-systeem te gebruiken. Maar dat is een systeem dat allerlei diacritische tekens gebruikt die in het Engels worden weggelaten. De Engelse WP vermeldt bij bijvoorbeeld Delhi de naam in het Hindi, Urdu en Punjabi, helaas zonder translitteraties erbij, maar de Duitse WP doet dat wel: Delhi heet in het Hindi Dillī. Daar lijkt het IAST-systeem toegepast te zijn. Analoog: Bangalore heet in het Kannada (niet verwant met Hindi overigens) Bengalūru. Voor Delhi en Bangalore gebruiken we gewoon de Engelse namen. Uiteindelijk doen Hindi, Urdu en Kannada er dus niet zoveel toe als het alleen om plaatsnamen gaat.

Mijn tegenvoorstel luidt dan ook als volgt:

  1. Translittereer Hindi en (en alle andere talen van het subcontinent die het Devanāgarī-schrift gebruiken; het Urdu en het Kannada horen daar niet bij) volgens het IAST-systeem
  2. Anders gezegd: translittereer de talen van het subcontinent allemaal volgens de systemen die in de Angelsaksische wereld het meest worden toegepast; voor Hindi is dat het IAST-systeem

Voor plaatsnamen (hoort hier dus eigenlijk niet thuis):

  1. Gebruik de lijst van Taalunieversum om na te gaan of er een Nederlandse naam is
  2. Is die er niet, gebruik de Engelse

Fransvannes 19 jul 2006 10:43 (CEST)Reageren

Dat de namen origineel in engelse vorm voorkomen is waarschijnlijk in de meeste gevallen niet het geval, omdat de bevolking ten tijde van de kolonisatie (rond 1800) geen engels sprak. De plaatselijke manier een naam te schrijven zal in de eigen taal zijn geweest, deze wordt in het arabische- of devanagirischrift geschreven. De engelse versie is dan een transliteratie van het lokale schrift óf een weergave van hoe de engelsen de lokale naam hoorden. Frans' tegenvoorstel pleit voor een vernederlandsing van de engelse naam, niet de lokale. Dat betekent dat je twee stappen gebruikt om een lokale naam te veranderen. Als je daarentegen de engelse variant gebruikt maak je maar één stap, zodat de regels consequent blijven. Ik vind het verder "heel leuk" voor de taalunie dat ze ergens in oude atlassen vernederlandsingen van namen hebben opgezocht, maar deze namen worden (de meeste) nauwelijks gebruikt en zijn geen sterk argument de taalunie dan ook maar te volgen. Tokyo is Japans en zal dus bij de regels voor Japanse namen behandeld moeten worden. Tokyo is natuurlijk de Nederlandse naam, die moeten we gebruiken.
@Frans: ons verschil van mening komt telkens neer op dit punt: dat ik voor een transliteratie/vertaling ben die maar één stap volgt en dezelfde stap consequent maakt. Dat voorkomt dat je rijtjes uitzonderingen moet gaan opschrijven. En daarmee het aantal regels, het vermindert de potentiële onduidelijkheid (Torero's argument tegen de taalunie in de discussie in de kroeg). In dit geval komt het bovendien mooi uit: de Nederlandse vormen worden nauwelijks gebruikt. De taalunie lijkt dol op dit soort regels en rijtjes, maar ik denk dat we vooral consequent (helder) moeten zijn, dat voorkomt discussie. Woudloper 19 jul 2006 11:14 (CEST)Reageren
Woudloper, in jouw voorstel werden het Hindi en het Urdu feitelijk geheel gepasseerd. Dat kan, want het gaat je uitsluitend om plaatsnamen. Maar dan hoeven we het hier niet meer over het Hindi en het Urdu te hebben. Of je het met mijn translitteratievoorstel voor Hindi eens bent (IAST-systeem) hoor ik je niet meer.
Feitelijk gaat het je maar om één ding: de spelling van Kasjmir, die je niet aanstaat. En in het kielzog daarvan een rijtje andere namen, zoals Tokio. Goed, zie steun te verwerven om de Taalunieversum-afspraak gewoon overboord te zetten. Want het gaat jou uitsluitend daarom. Fransvannes 19 jul 2006 11:19 (CEST)Reageren
Nou, dat weet ik niet. Ik kan niet alle gevallen overzien waarop dat weer invloed heeft (zoals je bv. aangeeft: Tokyo). Ik bepleit hier alleen het negeren van de Indiase uitzonderingen die de taalunie geeft, die fenotisch Nederlands gemaakt zijn. Inderdaad was Kasjmir het geval waardoor ik op dit idee kwam, maar ik vind bv. Beloetsjistan net zo raar overkomen. Het gaat me erom de regel makkelijk te maken. Een andere mogelijkheid is Kasjmir te schrijven, maar dan moeten we een transliteratie uit het devanagiri consequent gaan gebruiken. Dan krijg je spellingen zoals ik in Shah Jahan gebruikte (Sjah Djahaan), maar waaronder de namen waarschijnlijk niet bekend staan. Net als overigens Peshawar niet als Pesjawar bekend staat.
Ik passeer Hindi/Urdu toch ook weer niet helemaal? Ik ga ervan uit dat de engelse versies transliteraties uit die talen zijn. Volgens mij (?) gebruiken de engelsen het IAST-systeem (min diacritische tekens), dus dan hebben we het wat dat betreft over hetzelfde lijkt me? De tabel waaraan je refereert is trouwens niet compleet: de diacritische tekens in het devanagiri worden niet behandeld, maar dat terzijde. Woudloper 19 jul 2006 12:01 (CEST)Reageren
Ik heb het gehad hiermee. Als je het niet zint dat we Nederlandstalige namen gebruiken op een Nederlandstalige site ga dan naar elders. Wae®thtm©2006 | overleg 19 jul 2006 11:58 (CEST)Reageren
Ik vind het niet erg Nederlandse namen te gebruiken, op Shah Jahan heb ik zelf de Nederlandse naam erbij moeten verzinnen zelfs, net als ik bv. op Zojipas namen zo Nederlands mogelijk maak. Ik wil dat in het vervolg liever of consequent doen, of helemaal niet. De regel die ik hier voorstel bespaart me het probleem van het transliteratie in het vervolg. Woudloper 19 jul 2006 12:05 (CEST)Reageren
Woudloper, probeer alsjeblieft 1) wél eerst de gevolgen van je voorstellen in kaart te brengen voor je ze doet en 2) je wél te verdiepen in de materie. De Engelse namen zijn géén toepassingen van het IAST-systeem. Dan was het immers geen Bangalore geweest, maar Bengalūru en geen Delhi, maar Dillī. De indruk blijft bestaan dat het je alleen om Kasjmir te doen is. Ik trap er niet meer in. Dit soort ad hoc discussies hebben we over Peking en Tokio ook gehad. Heropen ze allemaal maar, ik merk wel wat er na afloop nog van de Taalunie-afspraak over is. De allergemakkelijkste regel wil jij met speciale afspraken voor India om zeep helpen, met als argument dat dat gemakkelijker zou zijn. Een gotspe. Fransvannes 19 jul 2006 12:09 (CEST)Reageren
1) OK, sorry, ik had niet naar die gevallen gekeken maar wat plaatsjes in noord-midden India opgezocht, daarvoor bleek het wel te kloppen (hindi wordt daar het "zuiverst" gesproken, dus dat leken me de makkelijkste voorbeelden). Maar die spellingen worden vrijwel nooit gebruikt dus dan kan ik me niet achter je tegenvoorstel scharen. 2) Gevolgen van mijn voorstel zijn er alleen in zes gevallen, die ik hierboven alle zes heb vermeld. Als mijn argumenten A) dat het consequent is; B) mijn door jou vermeende argument dat het esthetisch lelijk is Kasjmir te schrijven (dat ontken ik!) je niet aanstaan zou je toch op zijn minst moeten reageren op het argument C) dat het de meest voorkomende Nederlandse spelling betreft in alle 6 gevallen i.p.v. te zeggen dat het een gotspe zou zijn op de bestaande regel een uitzondering te willen maken. Woudloper 19 jul 2006 12:20 (CEST)Reageren
Woudloper het is heel erg eenvoudig. Het doel, de missie van deze website is een NEDERLANDSTALIGE encyclopedie te schrijven! We richten ons dus op schrijfwijzen in de Nederlandse taal. Let op de taal die men in NEDERLAND schrijft/praat komt niet 100% overeen met de NEDERLANDSE taal. Daar zit een verschil tussen. Wat jij probeert voor te stellen is de NEDERLANDSE taal overboord te gooien ten faveure van vreemde spellingen. Waarmee dus op onze hoofdpagina een leugen komt te staan, wij zijn dan immers niet meer de NEDERLANDSTALIGE wikipedia. En wij hebben dan eigenlijk geen recht meer op de TAALKODE NL! Dit is een taalkode namelijk GEEN landkode op wikipedia. Wae®thtm©2006 | overleg 19 jul 2006 12:23 (CEST)Reageren
Ja, maar wat is dan de Nederlandse taal? De taal volgens het boekje? Ik vind een uitslag van 300 versus 45.000 wel erg duidelijk overslaan naar een andere spelling dan die van het boekje. Ik wil ook gewoon weten hoe ik een plaatsnaam als ملتان of औरंगाबाद een nederlandse titel geef als ik er over wil schrijven. Dat was de eerste bedoeling van mijn voorstel. Sommige kranten negeren het boekje trouwens, terwijl ze wel Nederlandse kranten zijn. Woudloper 19 jul 2006 12:52 (CEST)Reageren

Dat Kasjmir vaak genoeg voorkomt heeft de Taalunie vastgesteld. Dat soort discussies ga ik níet elke keer overdoen. Argument c is het creëren van uitzonderingssituaties bij elk geval waarvan iemand komt voorrekenen dat de lijst van de Taalunie niet klopt. Vandaag Kasjmir, morgen Tokio, overmorgen Peking, en volgende week weer wat anders. Tot er weer iemand langskomt die de berekeningen weer betwist. Of vindt dat het Nederlands sowieso voorgaat. De gevolgen van je voorstel zijn bovendien zeer groot: waarom zou zo'n speciale afspraak zich immers tot India moeten beperken? Huppekee, vandaag India, morgen Japan, overmorgen China en dan de rest van de wereld. Fransvannes 19 jul 2006 12:26 (CEST) Heb je mijn tegenvoorstel trouwens wel begrepen, Woudloper? Het impliceert dat we bij Delhi en Bangalore de Engelse naam kiezen. Dat is toch de meest gebruikte? Het translitteratiesysteem regelt alleen maar dat de Kannada-naam van Bangalore daarbij (tussen haakjes) wordt weergegeven als Bangalūru, en niet als, bijvoorbeeld, Bangaloeroe.Reageren

Zo'n vaart hoeft het niet te lopen maar ik vind dat je wel een punt hebt. Dan nog, vind ik een uitslag 300 vs 45.000 wel heel erg veel. Wel zie ik nu (nog eens lezen, ik heb vannacht niet geslapen, sorry voor mijn gebrek aan concentratie) idd. in dat ons enige verschil is dat ik een uitzondering voor de zes namen wil maken. Met jouw tegenvoorstel ben ik het dus grotendeels eens. Als we de lijst uit het boekje toch letterlijk overnemen moeten we wel nog een beslissing nemen over Jammu en Kasjmir. En misschien nog eens naar kasjmier en kasjmiri kijken. De lijst volgen geeft, zoals ik al zei, onduidelijkheid en grensgevallen, waar dan weer andere regeltjes voor nodig zijn enz.... Woudloper 19 jul 2006 12:52 (CEST)Reageren
Aan die uitzondering voor die zes namen zul je een harde dobber krijgen, maar ik kan je niet tegenhouden.
Wat de deelstaat betreft: de keus lijkt me die tussen Jammu and Kashmir en Jammu en Kasjmir. Ik zou voor de laatste optie kiezen, ook om niet nog een derde spelling voor Kasjmir te hoeven introduceren. Plus de afleiding Kasjmiri, voor de inwoner en de taal (dus met een grote K). Op die beide punten geeft geen enkele lijst antwoord, dus ik ben best bereid een andere lijn te volgen als je daar goede argumenten voor hebt.
Wat kasjmier betreft: dat is alleen de spelling voor de stof. Dat staat nu eenmaal zo in het Groene Boekje, misschien omdat deze spelling in de stoffenwereld is ingeburgerd. Dat weet ik niet. Van Dale zadelt ons daarbij ook nog met een kasjmiergeit op, die qua spelling dus wordt gemodelleerd naar de stof die hij levert en niet naar het gebied waar hij thuishoort. Consequentheid is in deze: het GB resp Taalunieversum volgen, ook als het resultaat moeilijk navolgbaar is. Alle ad hoc-afspraken om die beide lijsten los te laten zullen leiden tot de verwarring die jij en ik niet wensen. De sabbat-discussie toont aan hoezeer men hier hecht aan de voorkeur van de spellingsinstanties. Als we voor een stof en een geit de GB-spelling overboord kieperen, zal dat leiden tot een nieuwe episode in de sabbatstrijd. Dus ook hier: bezint eer ge begint. Fransvannes 19 jul 2006 13:06 (CEST)Reageren

Het is maar welke argumenten je zwaarder laat wegen dan. Maar uitzonderingen maken heeft idd. invloed op andere talen/gebieden. Wel negeer je dan de meest gebruikte spellingen, en de inconsequentie van Pasjawar vs. Karachi (ik kan me herinneren dat ik ook wel eens Karatsji gezien heb, en Moeltan). Ik geloof dat bv. NRC Pashawar en Baluchistan spelt (helaas is hun site niet meer vrij toegankelijk).

Wat het specifieke geval Jammu en Kasjmir betreft: het argument dat we Bas-Rhin gebruiken en niet Beneden-Rijn? Als je Jammu en Kasjmir gebruikt ben je inconsequent tegenover de Franse namen. Ik vind dat als we Kasjmirvallei en Kasjmiri gebruiken, de inconsequentie met Jammu & Kashmir groter dan dat, maar er is ook weer inconsequentie door Jammu niet te vernederlandsen. Die geit, is dat niet synoniem met pashminageit/pasjminageit? Dan kunnen we het synoniem gebruiken om van het beest af te zijn. Woudloper 19 jul 2006 13:21 (CEST)Reageren

Helaas moet ik hier passen: ik weet niets van geiten en Van Dale vermeldt geen pasjminageit (en dus wel de kasjmiergeit). Wat de deelstaat betreft: er is geen inconsequentie door Jammu níet te vernederlandsen, want er ís geen Nederlandse naam. Voor Jammu dus niet, voor Kasjmir wel. De vraag is: neem je de hele Engelse samenstelling over of maak je die samenstelling zelf door Jammu en Kasjmir aan elkaar te plakken. Als je het voegwoord en gebruikt, maak je de samenstelling zelf met behulp van beide samenstellende delen, waarvan er een Kasjmir is (Nederlands) en een Jammu (Engels, bij gebrek aan Nederlands). Ik vind Jammu and Kashmir ook prima. Als het maar geen Jammu en Kashmir wordt. Fransvannes 19 jul 2006 13:27 (CEST)Reageren

Ik voel ook een lichte voorkeur voor de eigen spellingen bij bestuurlijke districten e.d.

Nu zijn we toch bezig de regels te interpreteren, terwijl ik daar nou juist graag een einde aan zou zien... Woudloper 19 jul 2006 13:31 (CEST)Reageren

Een schone illusie, welke afspraak je ook maakt. Tenzij je geen enkele afspraak maakt. Maar daar is ook niemand mee geholpen. Fransvannes 19 jul 2006 13:45 (CEST)Reageren

Een veel gemaakte fout is meer regels aan te maken ipv. eerst de bestaande regels te verduidelijken. Een ambtenaren-fout, populistisch gezegd. En de taalunie bestaat uit ambtenaren. (Torero's redenatie)

Ik wil wat meer mensen zien reageren. Er liggen nu twee voorstellen en er is behoorlijk gediscussieerd. Ik kap er voorlopig even mee. Woudloper 19 jul 2006 14:26 (CEST)Reageren

Wat laat jij je verschrikkelijk in je politieke kaarten kijken, Woudloper. De Taalunie heeft het gedaan, ambtenaren deugen niet, en zo verder en zo voort. Je voorstel helemaal boven aan deze pagina is dus onverkort van kracht? Dan ben ik inderdaad benieuwd naar de voorkeuren van anderen. Laat het verder maar even sudderen: jouw voorstel, of het mijne of een derde variant: we zullen het wel zien. Fransvannes 19 jul 2006 14:33 (CEST)Reageren

Da's niet politiek bedoeld, gewoon een vaststelling van een mechanisme (ik wil op wiki liever nietover politiek praten maar ben zeker geen LPF-er of andere populist die op de ambtenarij wil bezuinigen). Ik voel persoonlijk wel voor jouw voorstel. Ik wil gewoon nu wat anderen horen. Er moet wat discussie zijn, misschien zijn er meer argumenten of nog andere voorstellen waar we nog op kunnen wachten. Woudloper 19 jul 2006 14:40 (CEST)Reageren

Nieuwe discussie bewerken

Er zijn internationale regels voor het gebruik van bepaalde letters voor klanken. John schrijven we in het Nederlands ook niet als Djon. Het Hindi/Urdu volgen het Engels niet helemaal: oe klanken worden geschreven als u en niet als oo in Engels, ie klanken als i en niet als ee in Engels, etc.

Geef mij die regels! Het Engels gebruikt voor de oe-klank overigens overigens zowel oo als u als o. Etc. Zondigt het Engels daarmee tegen een internationale afspraak? Wat een onzin. Fransvannes 19 jul 2006 14:53 (CEST)Reageren

Het gaat er heet aan toe bij jullie! Hier mijn olie op de golven of op het vuur:

Wat gewone tekst betreft, ben ik voor de IAST-spelling, maar alleen op de 'fatsoenlijke' manier, d.w.z. met diacritische tekens. Het doet me wel enigszins pijn om dit voor te stellen, omdat niet elke browser de speciale tekens goed weergeeft (inclusief de mijne), maar de voordelen zijn te sterk: 1. Het is een transliteratie, d.w.z. uit de schrijfwijze kan de oorspronkelijke spelling in het Hindi etc. gereconstrueerd worden 2. De IAST-schrijfwijze lijkt vaak het meeste op de in Nederland gangbare.

Wel zou ik bij de eerste vermelding van een woord altijd de uitspraak tussen haakjes toevoegen, bijvoorbeeld: Urdū (Oerdoe). Voor die Nederlandse transcriptie bestaat momenteel geen standaard, dus daar kunnen we nog over discussiëren...

En dan over namen - ik heb de algemene Wiki-richtlijnen eens opgezocht:

"Hoe dan ook geldt de hoofdafspraak voor de spelling op Wikipedia voor bijvoorbeeld buitenlandse woorden die in naslagwerken zoals het Groene Boekje en de Dikke Van Dale voorkomen. Een woord als het Arabische hadith komt bijvoorbeeld in het Groene Boekje voor, vandaar dat dit zo wordt gespeld, en niet als hadieth. Daarnaast moet vaak evengoed het endoniem van een plaatsnaam getranslitereerd worden, zodat de lezer bijvoorbeeld ook te weten kan komen wat Moskou in het Russisch is (namelijk Moskva, de transliteratie van het cyrillische Москва). Voor geografische namen gebruiken we de spelling op de site van de Nederlandse Taalunie, en wel de lijst Buitenlandse aardrijkskundige namen in het Nederlands."

Iets verder nog:

"In het algemeen zijn er verder ruwweg drie mogelijkheden:
  • Het zodanig translitereren, dat de intuïtieve uitspraak van een willekeurige Nederlander zo dicht mogelijk de correcte uitspraak benadert, of:
  • Het aanhouden van een of ander gangbaar wetenschappelijk transliteratiesysteem, of:
  • Het weergeven in fonetisch schrift, volgens IPA of SAMPA.
Vanwege de laagdrempeligheid van Wikipedia, verdient de eerste optie de voorkeur, aangezien de lezer bij de andere opties al een systeem moet hebben geleerd of moet leren."

Als we dus IAST gebruiken en daarbij ter verduidelijking een Nederlandse transcriptie, zitten we volgens mij aardig op de algemene Wiki-lijn. Ik ben benieuwd wat jullie ervan vinden.Geke 5 aug 2006 17:21 (CEST)Reageren

Ik vind dit, als uitbreiding/verduidelijking op Frans' voorstel, een goed idee. Ik ben nl. wel voor het behouden van diacritische tekens. Wat doen we echter met de lemma-titels? Het kan maar 1 van de twee zijn, dus dan wordt het de IAST naam inclusief diacritische tekens?
Wat het Urdu betreft, er is al een goede transliteratieregel voor het Farsi, en de twee schriften verschillen niet zoveel van elkaar. Misschien kunnen we daar eens naar kijken?
Verder wil ik nog even (nog nagenietend van de discussie over Istanbul/İstanbul) de opmerking maken dat de taalunie voor bepaalde gevallen, waarin een naam niet in hun endoniemenlijst voorkomt, toch meent een alternatieve spelwijze te moeten aanbevelen (waarschijnlijk) omdat er diacritische tekens in voorkomen! Woudloper 5 aug 2006 18:25 (CEST)Reageren

Sorry, is een lemma-titel hetzelfde als een artikel-titel? Zo ja, zijn diacritische tekens daarin überhaupt technisch mogelijk? Maar op je vraag zou ik antwoorden: IAST (met of zonder diacritische tekens) als het woord op die manier ingeburgerd is, en anders volgens een Nederlandse transcriptie.

Dit lijkt wel het omgekeerde van wat ik eerder voorstelde, zul je zeggen! Dat komt, omdat ik een gebruikelijke spelling wil respecteren, maar in alle andere gevallen duidelijk de voorkeur geef aan Nederlandse transcriptie.

Nog iets over de diacritische tekens in IAST: In feite vind ik alleen de lengte-strepen belangrijk in lopende tekst, want die maken echt wat uit voor de uitspraak door leken; maar als je dan toch bezig bent is het goed om het systeem correct te volgen zodat het ook wetenschappelijk verantwoord is.

Weet je, wat ik EIGENLIJK het liefste zou willen is helemaal geen IAST, maar Nederlandse transcriptie en tussen haakjes oorspronkelijk schrift (dus Devanagari, Bengali, etc.) - wat heeft zo'n Engelse uitvinding tenslotte te zoeken in een Nederlands artikel over een Indische taal? Helaas kan dat niet, omdat zoveel woorden via het Engels bij ons ingeburgerd zijn, dat de Engelse schrijfwijze een soort standaard geworden is. En verandering is moeilijk, alweer helaas, omdat men het vaak belangrijker vindt hoe een woord er uitziet dan hoe het klinkt, zodat een bepaalde schrijfwijze al gauw als de enige echte ervaren wordt.

Volgend punt is inderdaad: Welke vormen bij Taalunie, Groene Boekje, of Van Dale nemen we over? Daar zal ook wel iets over staan ergens in onze Wiki-richtlijnen. Ik zou zeggen: alleen wat echt moet!

Urdu-transliteratie: Ik kan geen Arabisch lezen (bij Urdu denk ik eerder aan Devanagari met nukta-tekens...), maar ik neem aan dat de Wiki-tabel voor Arabisch zich makkelijk laat aanpassen voor Urdu en Farsi. Hopelijk komt dat een beetje overeen met de Farsi-transliteratie die jij noemt? Geke 6 aug 2006 23:53 (CEST)Reageren

Als ik het goed begrijp stelt Geke een systeem voor waarin namen op drie manieren worden weergegeven: 1) in het oorspronkelijke schrift, 2) in IAST, met streepjes en 3) in Nederlandse transcriptie. Dat lijkt me te veel van het goede. De meeste namen (van personen bijvoorbeeld) zullen één keer genoemd worden, anders wordt het artikel onleesbaar. En die Nederlandse transcriptie: bestaat die? Wie gebruikt hem? Kunnen we ergens aan vastknopen? Als er alleen IAST is, is de keus niet zo moeilijk.
Dan de Taalunie: de afspraken daarover zijn de volgende: het Groene Boekje en de plaatsnamenlijst van Taalunieversum gaan altijd voor. Er is geen beginnen aan om eerst te moeten onderzoeken uit welke taal een woord komt voordat je weet hoe je het moet schrijven. Het gaat hier alleen om de weergave van het originele Hindi en Urdu. Tandoori staat bijvoorbeeld in het Groene Boekje, is dus een Nederlands woord, en wordt zo gespeld (komt volgens VD uit het Punjabi). Idem voor naan. Hier biedt Van Dale een aanknopingspunt: dit woord komt volgens VD uit het Hindi, en het Hindi-woord spelt VD als nān. Met streepje dus. Is dat IAST? Als we dat overnemen, geven we de Hindi-oorsprong van naan in het betreffende artikel dus weer als nān, terwijl het artikel zelf naan blijft heten. Fransvannes 7 aug 2006 11:09 (CEST)Reageren

Je hebt me goed begrepen, behalve mijn dromerij over 1. Nederlandse transcriptie en 2. oorspronkelijk schrift. Nee, als ik praktisch blijf zie ik twee mogelijkheden:

1. Gebruik in lopende tekst altijd de Nederlandse vorm (Groene Boekje, Van Dale, Taalunie, of een Nederlandse transcriptie); alleen bij het eerste voorkomen van een woord in een artikel wordt de IAST-schrijfwijze tussen haakjes toegevoegd. Bijv: "Tandoori (IAST: tanduri)".

Praktisch betekent dat, dat er twee soorten woorden in de tekst gaan voorkomen: 1. zulke die in Groen Boekje etc. voorkomen, meestal geschreven naar Engels model, en 2. zulke, geschreven op basis van Nederlandse uitspraak. Dus enerzijds "Tandoori (IAST: tandūri)" en anderzijds "Mleettsja (IAST: mleccha)". Dat zou verwarrend kunnen werken.

2. Gebruik de Nederlandse vorm als die bestaat, of anders de IAST-schrijfwijze; bij het eerste voorkomen wordt de Nederlandse uitspraak tussen haakjes toegevoegd. Dus "Mleccha (uitspraak: mleettsja)" en "Tandoori (uitspr: tandoeri)".

Om het voorstel compleet te maken: 1. Begin de woorden altijd met een hoofdletter, als aanduiding voor de lezer: "let op, importwoord, eventueel speciale uitspraak". 2. In de artikelaanhef kunnen alternatieve spellingen vermeld worden. Voor Tandoori bijv. zou dat de IAST-spelling zijn. 3. Er bestaat geen standaard voor Nederlandse transliteratie/transcriptie van het Sanskriet (nagevraagd via Taalunie en bij een professor in Leuven); ik betwijfel dus of er iets bestaat voor andere Indische talen. (Voor Urdu weet ik het niet - misschien kunnen we bij de Wiki-transliteratie voor Arabisch aanknopen?) Die Nederlandse transcriptie mogen we dus zelf bepalen.

Hoewel ik persoonlijk de voorkeur geef aan mogelijkheid 1, zie ik wel in dat 2. voordelen heeft. Het is daarbij bijvoorbeeld niet zo belangrijk hoe de Nederlandse transcriptie precies wordt toegepast, omdat er duidelijk "uitspraak" bij staat. Geke 10 aug 2006 23:46 (CEST)Reageren

Misschien is het nuttig om hier meteen wat over IAST te zeggen. IAST is gemaakt voor Sanskriet/Devanagari, niet voor andere Indische talen; bovendien zijn er in de loop van de tijd wat variaties op gekomen. Daar hebben ISO-15919 en de "ALA-LC" (Library of Congress)-transliteratie iets aan gedaan door, uitgaande van IAST, een nauwkeurig omschreven transliteratie vast te leggen voor alle Indische talen. De verschillen zijn erg klein, maar voor ons is de ALA-LC-tabel het handigste, omdat hij net iets meer op het bekende IAST lijkt. ISO-15919 heeft bijvoorbeeld een ringetje onder de vokaal-r in plaats van een puntje. Belangrijkste verschil van zowel ISO-15919 als ALA-LC met IAST is dat ook de 'e' en 'o' een lengtestreep hebben.

En dan is er nog ITrans, dat helemaal geen diakritische tekens heeft, maar hoofdletters en speciale combinaties gebruikt, bijv. naaraayaNa en RRiShi. Hierbij kan men namen dus niet met een hoofdletter beginnen! ITrans is ook gedefinieerd voor Urdu en de andere Indische talen.

Zo, nu heb ik even genoeg geschreven. Zeg maar wat jullie ervan vinden.Geke 11 aug 2006 17:46 (CEST)Reageren

Nee, nog iets: Door mijn verlangen naar een betere weergave van Sanskrietwoorden in de Nederlandse Wikipedia ben ik wat rond gaan kijken naar wat er al is, ook als reaktie op vragen zoals die van jullie. Zo kwam ik op het idee om een artikel te schrijven over 'Transcriptie en transliteratie van de talen van India'. Kan ik dat op deze artikelpagina doen? Het zal in kleine stukjes gebeuren, daarom kan ik niet meteen een echt artikel maken, maar moet gaandeweg tot een goede opzet komen. Wat is het verschil tussen deze 'projectpagina' en 'gewone' artikelen?Geke 18 aug 2006 16:26 (CEST)Reageren

Daarvoor kun je beter een nieuw artikel aanmaken. Woudloper 18 aug 2006 16:33 (CEST)Reageren
Terugkeren naar de projectpagina "Transliteratie- en transcriptiegids/Hindi en Urdu".