Comparación del léxico básico español, el inglés y el urdu

MALDONADO GARCIA, MARIA ISABEL

Comparación del léxico básico español, el inglés y el urdu

MALDONADO GARCIA, MARIA ISABEL

Dirixida por:

Francisco Marcos Marín Director

Universidade de defensa: UNED. Universidad Nacional de Educación a Distancia

Fecha de defensa: 20 de decembro de 2013

Tribunal:

María Lourdes García-Macho Alonso de Santamaría Presidente/a
María Antonieta Andión Herrero Secretario/a
Antonio Moreno Sandoval Vogal
Rosa María Espinosa Elorza Vogal
Carmen Hernández González Vogal

Tipo: Tese

Teseo: 355950 DIALNET

Resumo

El propósito de esta tesis doctoral se encuentra basado en identificar las diferencias y rasgos comunes entre el vocabulario básico del español, el inglés y el urdu. El fundamento de la originalidad de este estudio radica en que hasta el momento los estudios de comparación/ contrastación de este tipo son inexistentes. La finalidad de este contraste es asistir a los estudiantes de origen Pakistaní en el aprendizaje del español y el inglés y a los estudiantes cuya L1 es español o inglés en el aprendizaje del urdu. Y así todas las clases de palabras son comparadas en las tres lenguas Existen rasgos comunes entre las tres lenguas, por ejemplo; el urdu acepta numerosos vocablos del inglés al igual que el español y viceversa. Por otro lado, existen vocablos en el urdu provenientes del árabe que también son comunes en el español, ya que en éste último existen cuatro mil vocablos provenientes del árabe. Existen también diferencias; por ejemplo, el español y el inglés utilizan el alfabeto romano, mientras que el urdu utiliza el alfabeto persa, variante del árabe estilo Nastaliq y mientras que en el español y el urdu existen los géneros masculino y femenino en el inglés no existen. Esta investigación se apoya en extraer el vocabulario básico de las tres lenguas con el propósito de analizar su estructura léxico-semántica y de origen común desde un punto de vista etimológico con el propósito de establecer la existencia de un vocabulario indo-europeo común o no común y cuáles son los porcentajes de vocabulario germánico, latino, afro-asiático u otros y además el nivel de similitud léxica entre el español y el urdu y el español y el inglés. 1.1 Objetivos de la tesis y justificación del tema El propósito fundamental de esta investigación se basa en ser capaces de ofrecer a los profesores y estudiantes de inglés, español y urdu una visión global de las características fundamentales, similitudes y diferencias, con el fin de elevar la calidad de la enseñanza de las clases de palabras en las tres lenguas desde el punto de vista del hablante, sea este de habla inglesa, española o urdu-parlante. A través de este estudio se establecerán las peculiaridades de cada lengua además de averiguar las similitudes desde un punto de vista de las clases de palabras y dentro de esta aquellas similitudes fonéticas, ortográficas, etimológicas, etc., con el fin de encontrar un léxico indo-europeo común que sirva de ayuda para la enseñanza de cualquiera de las tres lenguas a los hablantes de las demás analizadas. 1. Averiguar aquellos elementos similares entre las clases de palabras de las tres lenguas. 2. Averiguar aquellos elementos dispares entre las clases de palabras de cada lengua. 3. Averiguar cuál es el nivel de similitud en la etimología de las tres lenguas. 4. Averiguar a partir de los datos obtenidos el nivel de similitud entre el inglés y el español y el español y el urdu. 5. Descubrir el vocabulario Indo-Europeo común. 1.2 Metodología El método seguido en este estudio es el siguiente: 1. Se identificará el vocabulario básico del inglés, español y urdu. Para ello se extraerá una lista de 1,000 palabras básicas que serán utilizadas en las tres lenguas como vocabulario básico. 2. Se realizará su clasificación por clases de palabras. Las categorías morfológicas utilizadas para este estudio son: a. Determinantes. b. Sustantivos. c. Adjetivos o locuciones adjetivas. d. Verbos o locuciones verbales. e. Adverbios o locuciones adverbiales. f. Preposiciones o locuciones preposicionales. g. Conjunciones o locuciones conjuntivales. h. Numerales, que aunque son adjetivos en las tres lenguas el diccionario de Oxford los clasifica separadamente. i. Las interjecciones que en el pasado fueron una categoría morfológica independiente y en el inglés aun lo son (exclamations). 3. Se extraerá cada clase de palabra de la tabla en las tres lenguas y se compararán los resultados. 4. Se realizará la clasificación etimológica de cada palabra incluyendo las lenguas vehiculares. 5. Se extraerán los términos pertenecientes a cada lengua de la tabla en las tres lenguas y se compararan los resultados. 6. Se obtendrá la distancia de los términos con el propósito de averiguar el nivel de similitud léxica. 7. Se analizarán los resultados obtenidos. CONCLUSIÓN La búsqueda de relaciones entre las lenguas del mundo ha sido una preocupación de los lingüistas desde tiempos inmemoriales. ¿Hasta cuándo es posible rastrear la ascendencia genealógica de una palabra? Esta es una pregunta que los lingüistas siempre se han preguntado, y múltiples estudios se han realizado sobre este tema. La aparición de los diccionarios etimológicos se basa en esta pregunta. Muchísimas teorías han aparecido sobre el origen de las lenguas. Algunos van hacia atrás hasta el principio de los tiempos, otros sólo hasta los tiempos de la Torre de Babel y otros han tomado una mayor enfoque darwiniano, o en otras palabras, evolucionista ya que la evolución biológica está naturalmente ligada a la evolución lingüística. Los lingüistas creen que los idiomas del mundo se pueden clasificar en siete familias de lenguas, las Altaicas, Chukchi - Kamchatka , Drávidas , Esquimales, Indoeuropea , Kartveliana y Urálicas. ¿These seven language families are hypothesized to form an ancient Eurasiatic superfamily that may have arisen from a common ancestor over 15 kya, and whose languages are now spoken over all of Eurasia¿ (2013, 1). La familia particular en la que basamos nuestro estudio es la indo-europea. El alemán August Schleicher (1853) lo que el primer lingüista que intentó la reconstrucción de una matriz común de la familia indoeuropea de lenguas. Por otro lado, Sir William Jones fue el primero en demostrar una descendencia común entre latín, griego y sánscrito (de un discurso en 1787), (2005, 95). Sin embargo, en lo que respecta a las lenguas pre-indoeuropeos, el vasco ha sido considerado como una de ellas y de acuerdo con Bonfante, Giuliano y Larissa (2002), el etrusco es un aislado no relacionado con otras lenguas europeas, se ha asignado por algunos la familia del tirreno, vagamente relacionado con la familia indo-europea de lenguas. La lengua etrusca data de 700 AC. tiene su propio sistema de escritura , que parece estar distantemente relacionado con el Griego. (2002, 49-51). Además, el sumerio parece datar del 4 º milenio AC y más tarde fue sustituido por la lengua acadia. En este estudio hemos identificado similitudes entre tres lenguas indoeuropeas de la germánica, romance y familias índicas de lenguas. Este estudio se basa en la comparación morfológica de las clases de palabras que revelan las similitudes y diferencias entre ellas con el objetivo de ayudar a la segunda adquisición del lenguaje y los problemas que enfrentan durante el aprendizaje. Adicionalmente, este estudio tiene como objetivo ayudar a los educadores en la enseñanza de las lenguas de síntesis, a priori, para ser capaz de identificar los problemas que surgen durante el aprendizaje de los alumnos, con el fin de asegurar la adquisición efectiva de la L2. Algunas de las dificultades identificadas están relacionadas con las interferencias de la L1. Por otro lado, hay cuestiones que afectan a todos los estudiantes de una lengua particular, independientemente de su L1, por ejemplo; la ausencia de artículos en urdu causa problemas a los estudiantes paquistaníes de otras lenguas, debido a la interferencia de L1 que los hace omitir artículos en múltiples ocasiones en la L2. Para los estudiantes que están aprendiendo el urdu como L2, en la concordancia de género, el número y las desviaciones constituyen una fuente de confusión, así como, los sonidos nasales no se encuentran en muchas lenguas, especialmente las lenguas románicas. Además, los cognados y falsos cognados están presentes en todas las lenguas, a veces asistiendo a los estudiantes y otras veces causando errores. Algunos de los temas importantes que afectan a todos los hablantes son el amplio uso de los verbos auxiliares en inglés, la diferencia entre ser y estar en español, el uso de ¿a¿ antes de un complemento personal, etc. Las gramáticas de las tres lenguas se han analizado con el fin mencionado anteriormente. Por otro lado, el vocabulario ha sido comparado con el fin de encontrar las similitudes en entre los términos de las tres lenguas (cognados) utilizando el algoritmo Levenshtein. Los cognados exactos de inglés y el español, así como los que son cognados parciales se han identificado con el propósito de ayudar a los estudiantes y educadores en el aprendizaje y la enseñanza. Además, los cognados exactos y parciales de español y urdu se han identificado con el mismo propósito. Adicionalmente, un estudio etimológico de los términos en las tres lenguas se ha llevado a cabo para diversos fines; a. El vocabulario indoeuropeo común ha sido revelado. b. Los términos en un par de lenguas que presentan el mismo origen han sido identificados. En este caso, un hallazgo notable es que el español y el inglés comparten 342 pares de términos originarios del latín. Algunos autores postulan que desde el punto de vista del vocabulario, inglés es en realidad una lengua romance. c. Un gran número de préstamos de inglés, árabe y persa en el urdu han sido revelados. Este hecho es una gran ventaja para los hablantes de lenguas que deseen aprender Urdu como L2. d. La similitud etimológica completa en los pares de español-inglés es de 368 términos con el mismo origen, o similitud etimológica del 36,8%. En los pares de español- urdu sólo existen 10 pares con un origen común. En este caso, la similitud etimológica completa es 1%. e. En el par de lenguas inglés-urdu, existen 14 pares con un origen común. Por lo tanto, la similitud es del 1,4%. f. En el aspecto de la semejanza léxica, la similitud total existente entre el léxico español e inglés es de 264 pares. La similitud léxica entre el español y el inglés es el 26,4 %. Lo cual tiene sentido, ya que la similitud entre el inglés y el francés es del 27%. Además 74 pares de términos presentan similitud en español y urdu La similitud léxica general de entre el español y el urdu es de 7,4 %. El estudio etimológico de las tres lenguas es importante, porque se encuentra inherentemente conectado a una relación prehistórica entre ellos. El estudio de las similitudes léxicas, por otro lado, revela esas conexiones los estudiantes pueden encontrar durante el estudio de la lengua, al mismo tiempo que las correspondencias entre el sonido y el significado de las palabras se derivan de términos ancestrales comunes, aunque en muchos casos estas relaciones son difíciles de demostrar. Algunas de las cuestiones que se reflejan en este estudio son fundamentales para entender la evolución de las lenguas y la identificación de las familias lingüísticas. Después de todo, muchos lingüistas han comparado, y me adhiero a esta idea, las palabras con los fósiles o los coprolitos, que han de ser analizadas para conocer su historia, así como las relaciones entre ellas. PLANES FUTUROS Debido a la extensión de este trabajo ha sido imposible evaluar la distancia entre el inglés y el urdu. Asumimos que debido a la gran cantidad de préstamos recibidos del inglés, la adquisición del léxico del urdu no deberá ser demasiado compleja. En cualquier caso, es algo que debe analizarse. Esto requiere obtener la fonética de las palabras del urdu e inglés a través del sistema IPA y calcular la distancia de la misma manera que la distancia entre el español y el urdu fue calculada. Profundizar en el estudio de las clases de palabras desde un punto de vista comparativo sería de importancia y podría contribuir considerablemente, ya que nuestro estudio fue muy breve y se aborda desde la perspectiva de la adquisición de segundas lenguas. Esta investigación podría llevarse a cabo a partir de puntos de vista morfológicos, sintácticos, semánticos, fonéticos, fonológicos, así como de otros aspectos. En este estudio el léxico no ha sido comparado a través de la fonética (excepto la distancia entre español y urdu). Tal comparación podría ser de gran ayuda para los educadores y estudiantes de segundas lenguas. Un gran número de evaluaciones y análisis son alcanzables y serían prácticos para llevar a cabo. Además, se pueden realizar estudios similares con el fin de completar la tabla número 2. BIBLIOGRAFÍA (1) AARTS,B. (2011): Oxford Modern English Grammar. New York, Oxford University Press. (2) ALARCOS LLORACH, L (2000): Gramática de la Lengua Española. Real Academia Española. Madrid, Editorial Espasa Calpe. (3) ALVAR, M. (2000): Introducción a la Lingüística española. Barcelona, Ariel Lingüística. (4) AMEKA, F. (1992): Interjections: The universal yet neglected part of speech. North Holland, Journal of Pragmatics. (5) BASHIR, E. (2011): Urdu and Linguistics: A Fraught but Evolving Relationship. Milwaukee, WI, Annual of Urdu Studies. Vol. 26. (6) BLAIR, F. (1990): Survey on a shoestring. Dallas, Summer Institute of Linguistics and the University of Texas at Arlington publications in Linguistics, publication 98. (7) BONFANTE, G. & L. (2002): The Etruscan Language: An Introduction. Revised Editon. UK, Manchester University Press. (8) BUTT, BÖGEL ET AL. (2007): Urdu Grammar Report. Parc. Baden-Württemberg, Germany, University of Konstanz.. http://www.digitallibrary.kcci.com.pk/bitstream/32417747/549/1/PaGr07Cal-urdu.pdf (9) BELTRAN A. J. & SAÍZ LÓPEZ, A. (2008): La comunidad pakistaní en España. Barcelona, Anuario Asia-Pacífico. (10) CIA WORLD FACTS https://www.cia.gov/library/publications/the-world-factbook/geos/sp.html https://www.cia.gov/library/publications/the-world-factbook/geos/pk.html https://www.cia.gov/library/publications/the-world-factbook/geos/in.html (11) DOWSON, J. (1908): A Grammar of the Urdu or Hindustani Language. London, Kegan Paul, Trench, Trubner & Co. (12) DRYER, M. S. & HASPELMATH, M. (2011): The World Atlas of Language Structures Online. Munich, Max Planck Digital Library. Available online at http://wals.info/. Accessed on 2013-08-14. (13) EASTWOOD, J. (1994): Oxford Guide to English Grammar. Oxford, Oxford University Press. (14) ETHNOLOGUE. http://www.ethnologue.com/language/spa http://www.ethnologue.com/language/eng http://www.ethnologue.com/language/urd (15) GOMEZ TORREGO, L. (2005): Gramática Didáctica del Español. Madrid, Ediciones SM. (16) GONZÁLEZ CALVO, J.M. (2000): ¿Morfología nominal¿ en M. Alvar Introducción a la Lingüística española. Barcelona, Ariel. (17) HAENSCH, G & OMENACA, C. (2004): Los Diccionarios del español en el siglo XXI. Salamanca, Ediciones Universidad de Salamanca. (18) HAQ, M. A. (1987): ¿¿¿¿ ¿¿¿ ¿ ¿¿¿ .Aligarh, Amjuman-e-Taraqqi Urdu (Hind). (19) HOLMAN, E. W.(2011): Automated Dating of the World¿s Language Families Based on Lexical Similarity. Current Anthropology. New York, Wenner Gren Foundation for Anthropological Research. (20) INSTITUTO CERVANTES. Centro Virtual Cervantes. http://cvc.cervantes.es/lengua/anuario/anuario_12/i_cervantes/p01.htm (21) JAVED, I. (1981): ¿¿¿ ¿¿¿¿ ¿¿¿¿¿, New Delhi, Taraqqi Urdu Bureau. (22) KHAN, I. H. (1989): Studies in Contrastive Analysis. Aligarh, Aligarh Muslim University. Department of Linguistics. (23) KOUL, O. N. (2008): Modern Hindi Grammar. Virginia, Dunwoody Press. (24) LÁZARO CARRETER, F. (1975): El problema del artículo en español. Una lanza por Bello. En Homenaje a la memoria de D. Antonio Rodríguez Moñino. Madrid, Castalia. (25) LEVENSHTEIN, V. I.(1966): Binary codes capable of correcting deletions, insertions, and reversals. Akademii Nauk. Moscow, Soviet Physics Doklady. (26) MARCOS MARÍN, F., SATORRE GRAU, F. J. & VIEJO SÁNCHEZ, M. L. (2002): Gramática española. Madrid, Editorial Síntesis. (27) MARCOS MARÍN, F. (1980): Curso de Gramática Española. Madrid. Editorial Cincel. (28) MONACHINI, M. (1995): ELM - IT: An Italian Incarnation of the EAGLES - TS. Definition of Lexicon Specification and Classification Guidelines. Pisa, Technical report. (29) NIETO, P. (2001): Vocabulario español-inglés-urdú y viceversa. Barcelona, Editorial Sísifo. (30) PAGEL ET AL. (2013): Ultraconserved words point to deep language ancestry accross Eurasia. USA, Proceedings of the National Academy of Sciences. (31) PLATTS, J. T. (1909): A Grammar of the Hindustani or Urdu Language. London, Crosby, Lockwood and Son. (32) RAHMAN, T. (1998): ¿Regional Report on Pakistan: Indo-European¿. In the Yearbook of South Asian Languages and Linguistics. New Delhi,Sage Publications. (33) REAL ACADEMIA ESPAÑOLA (2010): Nueva gramática de la lengua española: Manual. Madrid, Espasa Libros. (34) SCHMIDT, R. (1999): Urdu, an Essential Grammar. New York, Routledge. (35) SIMPSON, J. & WEINER E. (1989): The Oxford English Dictionary. United Kingdom, Oxford University Press. http://oxforddictionaries.com/ (36) URDU DICTIONARY (2011) Urdu Encyclopedia. Islamabad, Ministry of Science and Technology. http://www.urduencyclopedia.org/urdudictionary/ (37) VAN WYHE, J. (2005): The Descent of Words: Evolutionary Thinking 1780-1880. Michigan, Endeavour-Elsevier. (38) WOLTZENLOGEL PALEO, B. (2007): An Approximate Gazetteer for GATE based on Levenshtein Distance.Dublin, Proceedings of the Twelfth ESSLLI Student Session.