Facultad de Ciencias de la Información

 Curso: 2003/2004.

Profesor: Félix del Valle Gastaminza fvalle@ccinf.ucm.es

 

Diseño de Bases de datos

Una base de datos es una colección de datos interrelacionados y almacenados en conjunto. Son gestionadas por un software de Gestión de base de datos. Los datos se organizan en unidades denominadas registros y estos, a su vez, se organizan en áreas o zonas denominadas campos.

Mundo real

Base de datos

Entidades

Registro

Atributos

Campos

Las BD pueden organizarse a partir de dos modelos de datos diferentes, el modelo relacional y el modelo documental o textual.

Modelo relacional. Es el que caracteriza a los sistemas de gestión administrativa. Utilizan una serie de tablas que almacenan información relativa a un conjunto de datos relacionados. Las tablas están organizadas en forma de filas y columnas, que definen los registros y los campos. Las tablas pueden relacionarse entre sí a partir de campos comunes lo que garantiza su versatilidad.

Modelo textual. Mucho más apropiado para tratar documentos es el modelo textual, basado en el fichero invertido y en campos de extensión variable con valores repetidos.En este modelo cada cadena de caracteres puede ser punto de acceso al registro, lo cual constituye una de las principales diferencias con el modelo relacional. El registro se constituye así como representación del documento original y, a la vez, cada término o palabra puede servir de punto de acceso al documento.

Los elementos característicos de una BD Documental son:

  • Modelo de registro textual integrado por campos de extensión variable basado en un diccionario de datos.
  • Fichero invertido.
  • Diccionarios de control de indización (diccionarios de palabras vacías, diccionarios de sinónimos, diccionarios de autoridades)
  • Sistema de recuperación basado en el álgebra de Boole que permita realizar combinaciones lógicas entre conjuntos de documentos
  • Sistema de recuperación basado en relaciones entre cadenas de caracteres.

Diccionario de datos: Lista detallada de cada uno de los campos que forman los distintos modelos de registro de la base de datos. A cada campo de cada modelo de registro se le aplica una parrilla de análisis que contempla, como mínimo, los siguientes aspectos:

 

Etiqueta Nombre del campo
Dominio Conjunto del que un campo puede obtener sus valores
Tipo Tipo de datos que admite el campo. Numérico (permite búsquedas aritméticas o por rangos de valores), Alfanumérico (admite números pero los trata como caracteres), fechas(en formato establecido que permitirá búsquedas por rangos de fechas o por valores superiores o inferiores a una fecha) y lógico (admite uno de dos valores, SI/NO V/F).
Tratamiento de indización Indica si el campo está indizado y cómo es la indización (por palabras, términos, frases o campo completo)
Tratamiento documental Establece si se debe utilizar algún lenguaje documental para introducir los valores del campo
Lengua Lengua en la que se introducen los valores del campo, puede ser la de la BD o la del documento.
Otros controles de validación Indicación de que el campo no puede quedar vacío; limitaciones de rango.

 

 

Ejemplo:

 

Se ha diseñado una base de datos de prensa con los campos siguientes: 

AUTOR:  AGENCIA: PERIODICO:  EDICION: FECHA: PAGINA: SECCION: GENERO: TITULO: RESUMEN: IDENTIFICADORES: TEMAS: PERSONAS: LUGARES: IPTC CODES:

Etiqueta AUTOR
Dominio Personas físicas susceptibles de firmar artículos de prensa
Tipo Alfanumérico
Tratamiento de indización Sí. Por palabras, y campo completo
Tratamiento documental APELLIDOS, nombre
Lengua  La del documento.
Otros controles de validación

 

 

Etiqueta FECHA
Dominio Cualquier fecha anterior a la actual.
Tipo Fechas
Tratamiento de indización Sí, campo completo
Tratamiento documental AAAA/MM/DD
Lengua
Otros controles de validación No puede quedar vacío.

 

 

 

 

AUTOR: BONET, Pilar. AGENCIA:

PERIODICO: EL PAIS. EDICION: Madrid.

FECHA: 94/12/22. PAGINA: 4. SECCION: Internacional.

GENERO: Crónica.

TITULO: Varios civiles mueren en bombardeos en el centro de la capital de Chechenia.

RESUMEN: Un número indeterminado de personas murieron anoche a consecuencia de una serie de bombardeos realizados por la aviación rusa sobre el centro de Grozni, la capital de Chechenia. Una bomba cayó a menos de 200 metros de la residencia oficial del presidente de la república norcaucasiana separatista, Dhzojar Dudáiev, en pleno centro de la ciudad. El presidente ruso, Borís Yeltsin, ha ordenado a sus generales que aplasten la rebelión y restauren el orden constitucional y para ello ha decidido enviar dos batallones de élite de refuerzo.

IDENTIFICADORES: Guerra de Chechenia

TEMAS: BOMBARDEOS / POBLACION CIVIL / CIERRE DE FRONTERAS / MOVIMIENTOS DE TROPAS

PERSONAS: DUDAIEV, DHZOJAR / YELTSIN, BORIS

LUGARES: GROZNI / CHECHENIA / CAUCASO / RUSIA

IPTC CODES:     Object= News, Object Type= Current, Subject=Massacre, SRN= 16006000

 

 

©Félix del Valle Gastaminza fvalle@ccinf.ucm.es Despacho 208. Tel. 913942206. Página Web de Félix del Valle Home Page