|
Espacio
multimedia es una sección de CUADERNOS CERVANTES abierta
a las nuevas tecnologías. Queremos informar sobre las
novedades relacionadas con los medios de comunicación
(audiovisuales, informática, etc.) y su aplicación a la
enseñanza o a la investigación de la lengua y la literatura
españolas. La Redacción invita a los lectores a enviar
información sobre nuevos productos y servicios. cuadcerv@elr.es
|
Lexicografía Digital del español
Carlos
Soler / UNED
La disciplica que se encarga de la elaboración de diccionarios
y léxicos, la lexicografía, ha encontrado un gran apoyo y
una herramienta de mucha utilidad en las nuevas tecnologías.
El autor analiza a continuación qué se entiende por lexicografía
digital, aplicada al español.
La
imposición total de la tecnología en nuestra
vidas es cuestión de poco tiempo: vivimos en la era
de la información, todos tenemos una "vida digital",
e incluso una "inteligencia electrónica".
Hemos dejado de ser homo sapiens para convertirnos
en homo videns con la televisión y, últimamente,
en homo digitalis, debido al ordenador.
La informatización es un camino sin
retorno, sólo comparable a procesos históricos
tan relevantes como la romanización. Los bits
sustituyen al átomo, la cultura inmaterial a la material,
y las ventajas son tan evidentes que acabarán imponiéndose
por sí mismas. En el mundo de la edición lexicográfica,
estos avances son aún más visibles.
La lexicografía es la disciplina lingüística
que se encarga de la elaboración de diccionarios y
el conjunto de conocimientos lingüísticos relacionados
con ellos. Entre los problemas principales de los que se ocupa
la lexicografía se encuentran la selección de
vocablos ya sean términos técnicos, palabras
de uso popular o regional, términos en desuso, etc.
También tiene que decidir a cerca de los criterios
de organización de las entradas de un diccionario,
el carácter normativo o descriptivo de las definiciones,
la forma más adecuada para expresarlas, etc.
Las obras lexicográficas básicas
que producen hoy en día son el diccionario, el corpus
y la enciclopedia. El diccionario es un libro en el que se
ordenan alfabéticamente las palabras de un idioma,
una materia, etc., definiendo cada una de ellas o dando su
equivalencia en otras lenguas. El corpus es un conjunto lo
más extenso y ordenado posible de datos o textos científicos,
literarios, etc., que pueden servir de base a una investigación.
La enciclopedia es una obra o conjunto de obras en que se
expone un gran número de conocimientos sobre una o
más materias o ciencias.
La lexicografía en España comenzó
a regularizarse con el movimiento humanista en el siglo XVI.
Gracias a la invención de la imprenta se pudieron concebir
los primeros diccionarios. El diccionario como género
fue evolucionando a partir de los primeros modelos que aparecieron
desde entonces, enriqueciéndose siempre con la inclusión
de nuevos datos y técnicas, y a la vez diversificándose
según lo exigían las necesidades de los usuarios.
Hoy en día, el mundo de la lexicografía
avanza gracias a tecnologías multimedia, que se basan
en la integración de varios elementos, y no en la sustitución
de unos por otros: texto, sonido, fotografía y vídeo,
aparecen integrados en un solo documento. Por otro lado, la
confluencia la televisión, la informática, el
teléfono y los satélites permiten augurar un
porvenir con una ingente disponibilidad de informaciones multimediáticas.
Por eso la ediciones multimedia de los últimos diccionarios
publicados convierten la lectura o la consulta de éstos
en un acto motivador, caracterizado por la simultaneidad de
estímulos (visuales, auditivos, intelectuales).
Todos los diccionarios digitales del español
se caracterizan por tener esta vertiente multimedia en sus
ediciones en las que se combina la presentación de
varios tipos de información textual, gráfica
o auditiva por la que se puede navegar de forma asociativa
a través de vínculos.
Se pueden señalar dos momentos revolucionarios
en la historia de la práctica lexicográfica:
- En el siglo XVIII con la incorporación de la ficha
al ámbito lexicográfico;
- En el siglo XX con las posibilidades que aporta el uso
del ordenador en la elaboración de los diccionarios.
Este segundo momento que todavía está
en proceso de desarrollo ha supuesto una revolución
de gran importancia al haberse convertido el ordenador en
un instrumento imprescindible en el trabajo lexicográfico,
explorando una gran cantidad de posibilidades hasta hace poco
impensables para esta disciplina.
Entre los principales usos que hace en lexicografía
de la informática se pueden destacar:
- tratamiento de textos
- manejo de bases de datos
- análisis textual
- análisis gramatical
- autoedición
De todas estas aplicaciones informáticas
de la lexicografía, una de las más importantes
son las bases de datos, que constituyen una herramienta muy
útil para el trabajo lexicográfico, al tener
capacidad para almacenar cantidades ingentes de información
en los córpora, ya sean artículos de un repertorio
léxico, acepciones, combinaciones sintácticas
y semánticas, ejemplos, modelos de uso o fraseología.
Los diccionarios basados en córpora
son repertorios que muestran la lengua tal y como se considera
que es, ya que se basan en datos comprobados directamente
y no sólo en repertorios anteriores o conocimientos
de los lexicógrafos.
A este respecto cabe destacar los dos córpora
fundamentales del español que están en proceso
de elaboración en estos momentos por la Real Academia
Española, se trata de:
CREA Corpus de Referencia del Español
Actual (1975-2000)
CORDE Corpus Diacrónico del Español
(orígenes-1975).
Estos córpora lingüísticos
son un conjunto de datos lingüísticos (pertenecientes
tanto a la lengua oral como a la escrita) que están
sistematizados según una serie de criterios que son
procesados mediante ordenador con el fin de obtener resultados
variados tras una determinada búsqueda. Se componen
de amplio repertorio de textos que se representa como una
secuencia de elementos lingüísticos en la que
las palabras se diferencian gracias al espacio en blanco que
media entre una y otra. Cada palabra es etiquetada según
las diferentes posibilidades de búsqueda.
Los corpus lingüísticos han sido
muy útiles a los autores materiales didácticos
de enseñanza de idiomas ya que les permitían
seleccionar listados de vocabulario o textos de forma rápida
y eficaz. Si una voz aparece con frecuencia en un corpus quiere
decir que su incidencia e importancia en la lengua son muy
elevadas y por lo tanto es más lógico que un
los estudiantes extranjeros de esa lengua la conozcan antes
que otras de menor frecuencia o uso.
En el momento en el que el diccionario se
informatiza nos encontramos ante una nueva obra lexicográfica
con dimensiones y usos muy diferentes. Esto se puede comprobar
analizando la abundante producción de diccionarios
en formato electrónico, ya sean versiones electrónicas
en CD-ROM de diccionarios editados previamente en papel; o
diccionarios on line, verdaderos diccionarios digitales
exclusivamente suministrados a través de internet.
Los diccionarios en CD-ROM fueron la primera
forma de publicación electrónica que podemos
incluir dentro del ámbito de la lexicografía
digital, y actualmente constituye una de las formas más
populares para la edición de diccionarios y enciclopedias.
En 1995 la Real Academia publicó el
primer diccionario en CD-ROM del español, lo que dio
lugar a un sinfín más de ediciones de este tipo
a cargo de diferentes editoriales, como la versión
digital del Diccionario de uso del español actual
de María Moliner en 1996, o Clave. Diccionario de
uso del español actual de la editorial SM, que
apareció en 2000. Estos diccionarios están digitalizados,
pero no se pueden considerar diccionarios virtuales, ya que
no fueron elaborados con ese fin, son sólo una versión
electrónica de la impresa papel. Se trata de un soporte
alternativo al papel muy adecuado para este tipo de obras
de referencia de gran volumen.
Las principales diferencias entre los diccionario
en papel y los digitales se encuentran en:
- El uso
- La presentación de datos
- Sus posibilidades de búsqueda
- Los aspectos técnicos.
El paso del papel a la pantalla de un ordenador
no es nada desdeñable: El cambio que se produce al
leer un diccionario en contextos tan distintos no es sólo
un cambio físico, también envuelve diferencias
en su construcción y revisión. Del mismo modo
requiere más habilidades de navegación por parte
los usuarios que acceden a los diccionarios. El grado de fiabilidad
es otro factor que puede variar mucho en los diccionarios
que se encuentran en internet.
Los diccionarios digitales no están
sometidos a restricciones de espacio. Se tiene acceso a un
volumen importante de información de forma fácil,
rápida y económica. A la hora de consultarlos
normalmente se ven los datos aislados, es decir, sólo
se muestra lo que se pide.
Cualquier diccionario electrónico
comparte muchos aspectos con el concepto de hipertexto si
lo entendemos como una forma alternativa de organizar la información,
pues se organizan las entidades en forma de red, en lugar
de hacerlo como en una lista o una tabla.
Cuando el diccionario se informatiza los
parámetros que lo configuran se modifican parcialmente.
Se tiene que adaptar a las ventajas y los inconvenientes del
nuevo medio, a una nueva morfología en la que se combinan
texto, imagen y sonido. Los recursos multimedia han pasado
a formar parte de la expresión del discurso lexicográfico.
La pantalla se lee, se ve y se oye.
Estos diccionarios se miden por el tiempo
disponible para acceder a los datos y no por su volumen. Como
la información se ofrece a tiempo real la actualización
o renovación de los mismos debe hacerse con bastante
frecuencia.
Un aspecto que comparten los diccionarios
impresos con los digitales es su fragmentación a la
hora de distribuir la información. Ya que por su naturaleza
nunca se leen secuencialmente.
Pero para saber si los diccionarios que consultamos
en la red son fiables, o que el usuario pueda medir la respuesta
de estos productos según sus necesidades lingüísticas,
hay que establecer criterios de evaluación. Por eso
al hablar de lexicografía digital no sólo tenemos
que mencionar las innumerables ventajas, sino que también
debemos recordar sus inconvenientes.
Ventajas
|
Inconvenientes
|
Sistema de
búsqueda |
Fiabilidad
|
Reutilización
de la información |
Complicaciones
de uso |
Interacción
virtual |
Actualización
de la información |
El entorno digital rompe los moldes formales
de la lexicografía anterior porque se caracteriza precisamente
por ser muy heterogénea, aparecen, desaparecen y se
renuevan en la red constantemente. Además hay que tener
en cuenta que en internet el establecimiento de una tipología
lexicográfica rígida no se puede aplicar tan
fácilmente, ya que los diccionarios digitales son menos
estables y tienden a cambiar, transformarse o desaparecer
vertiginosamente.
El comportamiento del usuario también
cambia a la hora de hacer una consulta lexicográfica
a través de internet. En lugar de pensar en qué
es lo que se contiene en un diccionario impreso, si está
o no está una palabra; irá con la determinación
de encontrar lo que necesita de una forma u otra. Así
por ejemplo, ya no hace falta saber la ortografía de
una palabra para encontrar su definición, pues los
buscadores en los diccionarios digitales proporcionan la opción
de búsqueda por semejanza fonética u ortográfica.
Uno de los problemas más importantes
que diferencian a la lexicografía digital de la impresa
es la permanencia de sus datos. La existencia de los diccionarios
digitales es muy relativa, esto promueve la inestabilidad
en sus fuentes de información.
El diccionario resuelve determinadas necesidades
comunicativas del usuario: proporciona significados de palabras
que se desconocen en nuestra propia lengua, así como
su ortografía, el origen etimológico, su género,
etcétera. También tiene una utilización
como instrumento de enseñanza y aprendizaje de lenguas
extranjeras.
Hay una producción de repertorios
mucho más extensa por internet. Muchos de estos diccionarios
tiene unos objetivos o funciones muy concretas entre las que
destaca el componente lúdico o el entretenimiento,
para captar la atención de un público más
amplio.
Los diccionarios en papel dividen su estructura
lexicográfica en macroestructura y microestructura.
Los diccionarios digitales tienen a su vez una hiperestructura
en la que se incluye la organización general de la
información del diccionario. Lo que en los diccionarios
impresos equivaldría a un simple índice o sumario,
en los diccionarios digitales serían los menús.
El menú aparece normalmente en la primera pantalla
del diccionario, sustituyendo a los prólogos o prefacios
de los diccionarios en papel.
Los diccionarios electrónicos suponen
un gran avance en la concepción del diccionario como
objeto o libro en sí. Por eso a la hora de hablar de
diccionarios digitales tenemos que asociarlos con la particular
proliferación de eBooks. Un eBook o libro
electrónico es una publicación digitalizada
que ha sido confeccionada para utilizarse en un ordenador.
Su tamaño, estructura y diseño por tanto tienen
que ser tratados correctamente para que su visualización,
tiempo de descarga y posibilidades de utilización sean
rápidos y sencillos. Los eBooks presentan muchas
ventajas como el acceso desde cualquier parte del mundo, la
disponibilidad de compra inmediata, el tamaño físico
reducido y un precio más bajo. El libro electrónico
se lee en la pantalla de un ordenador. Para ello solo se necesita
del programa lector que nos permite descargarlo y visualizarlo.
Las páginas aparecen en la pantalla igual que en un
libro, y con el ratón se pueden pasar una a una, o
saltar de una a otra. El eBook entre otras facilidades
nos permite insertar anotaciones y colocar marcadores en pasajes
o párrafos concretos para volver a encontrarlos con
facilidad. También se puede subrayar o destacar en
varios colores el texto.
El formato típico de un eBook,
especialmente si éste contiene un diccionario o una
enciclopedia, es el CD-ROM o el DVD. Un CD-ROM es disco compacto
usado como soporte de información digital que utiliza
la técnica láser para su grabación. Por
su gran capacidad es perfecto para almacenar diccionarios
o enciclopedias. DVD son las siglas del inglés Digital
Versalite Disc o disco digital versátil. Es un
disco compacto con mayor capacidad de almacenaje que el CD-ROM
que requiere un lector específico.
En los últimos años, con el
desarrollo de los ordenadores, están alcanzando una
notable difusión los diccionarios enciclopédicos
en CD-ROM. Se trata de diccionarios que presentan una ordenación
de los artículos similar a la de los diccionarios enciclopédicos
en papel, pero tienen algunas diferencias:
- Para buscar un artículo, en los diccionarios enciclopédicos
en CD-ROM hay que escribir la palabra en un lugar determinado,
y el artículo se muestra automáticamente en
la pantalla.
- Al lado del artículo se muestra el esquema de la
información que contiene. Si pinchamos con el ratón
sobre cualquier elemento del esquema, la información
correspondiente se muestra automáticamente en la
pantalla.
Algunas partes del artículo pueden
mostrarse en otro color. Se trata de enlaces, es decir, zonas
que traen automáticamente otro artículo sólo
con pinchar sobre ellas con el ratón. Esto tiene la
ventaja de que podemos saltar de un artículo a otro
sin tener que buscar ni teclear la palabra.
Después de todo lo expuesto no hay
que dudar en afirmar que algo ha cambiado en el universo editorial.
Si Diderot y D’Alambert quisieran editar en nuestros días
su célebre Encyclopédie des Arts et des Métiers,
no tendrían más remedio que hacerlo en CD-ROM.
El formato digital se ha extendido a todos los ámbitos,
y de manera muy especial e irreversible a la lexicografía.
La lectura hipertextual se adapta perfectamente al modo de
consulta de diccionarios, enciclopedias, córpora, bibliografías
y otros bancos informativos, que se pueden editar electrónicamente
a coste reducido, con una mejora considerable en la presentación,
el manejo de datos, la actualización y los sistemas
de referencia.
Estos formatos electrónicos se han
hecho tan populares que periódicos y revistas los regalan
a sus lectores sin aumento de precio. Existen, en soporte
digital, multitud de diccionarios monolingües, multilingües,
especializados (de medicina, informática, vinos, botánica…);
correctores ortográficos, conjugadores verbales, analizadores
sintácticos, traductores, etcétera. La mayoría
pueden consultarse "en línea", a través de Internet
o se editan en CD-ROM.
Análisis de dos diccionarios digitales:
1. Diccionario de uso del español
de María Moliner, edición en CD-ROM de 1996:
La versión electrónica de este
diccionario no se limita a ser una simple reproducción
de la popular edición impresa, sino que se ha procedido
a una reorganización de las entradas. Por un lado se
ha cambiado la disposición del texto en la pantalla
para facilitar la lectura. Por otro, se han agrupado las entradas
en familias de palabras según sus raíces. Éstas
a su vez se dividen en entradas principales al encabezar una
familia de palabras, o subentradas si son derivadas de una
entrada principal. El usuario de este diccionario podrá
configurarlo para decidir el orden y la distribución
de la información de cada entrada según su interés.
Hay que destacar también su facilidad de manejo pese
a la gran cantidad de información que cada entrada
proporciona. Las palabras se pueden buscar de tres formas
entre la lista de entradas del Diccionario, en las
entradas o en los textos de las definiciones. Así se
pueden encontrar todos los significados de cualquier voz,
así como llegar a una palabra a través de sus
formas flexionadas o derivadas.
2. Diccionario de la lengua española
de la Real Academia Española, edición virtual
(www.rae.es) :
La Real Academia limpia, pule y navega
en la red. O al menos eso parece al entrar
en su página web www.rae.es en donde podemos
encontrar la vigésima segunda edición del Diccionario
de la lengua española actualizado y revisado constantemente
y, además, gratis. Como se explicar en la propia página,
las lenguas cambian continuamente, y lo hacen de modo especial
en su componente léxico. Por ello los diccionarios
nunca están terminados: son una obra viva que se esfuerza
en reflejar la evolución registrando nuevas formas
y atendiendo a las mutaciones de significado. Este es el motivo
de que la Academia se haya decidido a "colgar" su
Diccionario en la red, para que todos los hispanohablantes
estemos al día de cada cambio o novedad en nuestra
lengua, sin tener que esperar a las ediciones impresas del
futuro.
Cuando se presentó en octubre de 2001
la última edición del Diccionario se
anunció el cierre de una etapa histórica y la
apertura de otra porque, para conocer las nuevas voces que
se vayan aprobando, no será necesario esperar a la
publicación decenal en formato de libro que era habitual
desde 1780, sino que, periódicamente, estarán
disponibles en la página web de la Real Academia. Por
ello se ha puesto especial cuidado en el Diccionario académico
al que se otorga un valor normativo en todo el mundo de habla
española.
La Real Academia Española y las veintiuna
Academias americanas que con ella integran la Asociación
de Academias de la Lengua Española trabajan mancomunadamente
al servicio de la unidad del idioma tratando de mejorar y
actualizar un diccionario de carácter panhispánico.
Hasta hace poco tiempo la edición
en forma de libro constituía la única posibilidad
de fijación y transmisión. Los recursos electrónicos
de que hoy disponemos hacen posible un modo diferente de actuación.
El Diccionario académico es actualmente una base informática
de datos, lo que permite un mejor control de su contenido,
proporciona mayor facilidad de revisión y, sobre todo,
hace compatibles diferentes fases del trabajo sin las exigencias
que conlleva una edición impresa. De ahí el
compromiso adquirido de ir haciendo públicas con periodicidad
semestral las adiciones, supresiones y enmiendas que la Real
Academia Española y sus Academias asociadas vayan aprobando.
Lo que ahora mismo se ofrece
en la página de la Real Academia Española es
el conjunto de más de 12.000 modificaciones aprobadas
desde el cierre de la edición anterior hasta junio
de 2004. De este modo se puede disponer de una información
actualizada del trabajo académico y se facilita a su
vez el conocimiento de la evolución del español.
Otro de los principales logros de la versión
virtual del DRAE es la variedad de modos de consulta que se
ofrece para buscar una determinada palabra. Así como
los saltos hipertextuales que invitan a navegar desde prácticamente
todas la palabras que aparecen en una definición, a
través de enlaces y remisiones.
Bibliografía:
Alvar Ezquerra, M., La
enseñanza del léxico y el uso del diccionario.
Madrid, Arco/ Libros, 2003.
- y Villena Ponsoda, J. A., Estudios para un corpus del
español. Málaga, Universidad, 1994.
- Lexicografía descriptiva. Barcelona, Biblograf,
1993.
Ayala Castro, M. C. (coord.), Diccionarios y enseñanza.
Alcalá, Universidad, 2001.
Azorín Fernández, D., Los diccionarios del
español en su perspectiva histórica. Alicante,
Universidad, 2000.
Bajo Pérez, E., Los diccionarios. Introducción
a la lexicografía del español. Gijón,
Trea, 2000.
Calderón Campos, M., Sobre la elaboración
de diccionarios monolingües de producción.
Granada. Universidad, 1994.
Fuentes Morán, M. T. y Werner, R. (eds.). Diccionarios:
Textos con pasado y futuro. Madrid, Iberoamericana, 2002.
Gelpí Arroyo, C., "El estado actual de la lexicografía:
Los nuevos diccionarios" en Medina Guerra, A. M. (ed.),
Lexicografía española. Barcelona, Ariel,
2003.
Maldonado, C., El uso del diccionario en el aula. Madrid,
Arco/ Libros, 1998.
Moliner, M., Diccionario de uso del español. Edición
en CD-ROM. Madrid, Gredos, 1996
Sequera, R. (ed.) Ciencia, Tecnología y lengua española:
La terminología científica en español.
Madrid, FECYT, 2004.
V.V.A.A. Así son los diccionarios. Lleida, Universidad,
1999.
|