Tácticas para la búsqueda eficaz en bases de datos

Anuncio
Tácticas para la búsqueda eficaz en bases de datos
Kory L. Meyerink, MLS, GENEALOGISTA ACREDITADO, FUGA
Salt Lake City, Utah
Correo electrónico: [email protected]
En línea o sin conexión, la investigación genealógica moderna requiere de la búsqueda eficaz en
bases de datos. Con millones de nombres en cientos de diferentes bases de datos, es fácil que se
pierda un antepasado. El éxito de su investigación depende de que sepan la mejor manera de
buscar en cada colección. Los conceptos operador booleano, truncamiento, palabra clave, datos
de campo, proximidad, frase y comodín no son términos ajenos, sino más bien sus claves para el
éxito con la genealogía
BOSQUEJO DE ANÁLISIS
Tipos de bases de datos
De campo
Texto
Métodos o sintaxis de búsqueda
Palabra clave
Fonético (Soundex, Metaphone)
Caracteres comodín
Truncamiento
Frase
Operador booleano
Búsqueda de campo
Limitación
Proximidad
Búsqueda de cadena
Vocabulario controlado o encabezamientos de temas
Anidamiento (agrupación)
Técnicas de búsqueda
Menos es más
Elijan los campos correctos
Opciones de búsqueda avanzada
Términos alternativos
Experimenten
Catálogos de biblioteca
Datos de campo
Vocabulario controlado
Versiones alternativas de bases de datos
Ejemplos de operadores booleanos y búsquedas relacionadas
Tipos de búsqueda
contienen
Ejemplo de búsqueda
Una palabra (palabra clave) keokuk
AND (a menudo automático)
snow familia
O
(puede ser |)
nacimiento OR matrimonio
Encuentra resultados que
“keokuk”
tanto “snow” como “familia”
“nacimiento” o “matrimonio”
NOT (-)
chamberlain -neville
“chamberlain” pero no “neville”
Búsqueda de frase
“ciudad de nueva york”
la frase: “ciudad de
nueva york”
Sinónimos (palabras similares)
~genealogía
“árbol familiar” “historia familiar”
“apellido”
Stemming (variaciones de palabras) plasket
plasket y plaskett
Búsqueda forzada con palabra no significativa
+es
+para
“es” “para”
Truncamiento
casa
“casar” “casarse” “casado”
Caracteres comodín: uno
Sm?th
Smith, Smyth
Caracteres comodín: varios
pobla*
población, poblado, poblacho
Proximidad (cercano/adyacente)
ellis york@5
“ellis” y “york” a una
distancia de 5 palabras
Soundex (fonético)
chamberlain
chamberlin, chambers, etc.
Dónde encontrar otras versiones de algunas bases de datos
Sitios de base de datos genealógicas principales
Sitios estatales (especialmente para registros esenciales)
Páginas GenWeb de condados
Sitios de registros específicos (como de cementerios o listas de pasajeros)
Algunas colecciones “académicas”
Bibliografía de referencias de búsqueda
Calishain, Tara. Web Search Garage. Upper Saddle River, NJ: Prentice Hall, 2005.
Crume, Rick. “Top 10 Public Libraries”, FamilyTreeMagazine.com 10/8/2010.
Hill, Brad. Google for Dummies. New York: Wiley Pub., 2003. 360 págs.
Lynch, Daniel M. Google Your Family Tree. Provo: FamilyLink.com, 2008. 340 págs.
Mann, Thomas. The Oxford Guide to Library Research, 3ra edición, Nueva York: Oxford, 2005.
ProQuest Database Guide: Heritage Quest Online (En línea: ProQuest, 2010),
<http://www.proquest.com/assets/downloads/products/hqo_db_guide.pdf> consultado en
noviembre de 2013.
Research Buzz revista electrónica diaria por Tara Calishain <http://www.researchbuzz.com>
[email protected]
Comparación de funciones de búsqueda de bases de datos
Nota: Algunas bases de datos tienen distintos parámetros de búsqueda. [# indica cualquier
número]
Proveedor/Base
Fonético
de datos
Operador
booleano
Trunca- Comomiento dín
Frase
Proximidad
Búsqueda de
campo
Ancestry
Soundex
No
* después
*
de 3
No
No
Sí
Textos de
archivo de
internet
Aproximació AND, OR,
n~
NOT
*
*
“comillas” No
Búsqueda
avanzada
“comillas” No
Sí
Heritage Quest:
No
PERSI
and, or, not
*
No
Google
No
AND, OR,
NOT
Stem
palabra
“comillas” No
en frase
No
GNIS
No
auto and
*
*
“comillas” No
Sí
Bowker / Libros
and, or,
Desconocido
impresos
andnot
*
No
No
Búsqueda
avanzada
Chadwyck Healey
Desconocido and, or, not
*
?
pre
determinad cerca. #
o
Usar cuadros
de entrada de
campo.
RootsWeb
Soundex
Metaphone
No
*
*
“comillas” No
Sí
Fold3
No
AND, OR,
NOT
*
*
“comillas” No
Búsqueda
avanzada
World Bio. Info.
No
Systems
AND, OR,
NOT
*
*
“comillas” No
Búsqueda
biográfica
Newspaper
Archive
Sí, por
campo
No
No
Sí, campo No
Sí
Genealogy Bank No
and, or, not
*
?
“comillas” cerca#
Nombre y
fecha
The Genealogist Sí
No
*
No
No
Sí
Encyclopedia
Britannica
No
No
*
No
Búsqueda avanzada
no está
disponible
Origins
Network
NameX
No
*
*, ?
No
No
Ordenar
columnas
WorldCat
No
and, or, not
+, |, -
*o?
después
de 3
#, ?
“comillas” n#
Búsqueda
avanzada
GaleNet
No
and, or, not
*
?
“comillas” n#
Búsqueda
personalizada
JSTOR
No
and, or,
andnot
+ para
-s o es
No
Sí
Usar menús
desplegables
No
No
No
cerca
Diccionario
No
Oxford en inglés
and, or,
y not
*
?
pre
cerca,
determinad antes,
o
después
Usar menús
desplegables.
Definiciones
Operador booleano: Método de búsqueda con uno o más términos en combinación o en
exclusión mutua y con palabras de conexión (llamadas ‘operadores’) que definen la relación que
existe entre las dos palabras. Las palabras de conexión suelen ser: AND, OR, NOT. Lleva el
nombre de George Boole.
Vocabulario controlado: Se asignan diferentes palabras con significados similares o relacionados
a una palabra específica. Las búsquedas con esa palabra devolverán cualquiera de las palabras
asignadas. Ejemplo: Baviera, Prusia y Hessen se asignan a Alemania en las búsquedas de censo
de Estados Unidos de Ancestry.com.
Búsqueda de campo: Las solicitudes de búsqueda se hacen en campos determinados de forma
específica y sólo se encuentran concordancias en ese campo.
Datos de campo: Toda la información de una base de datos se ingresa en campos específicos,
tales como “Nombre”, “Lugar de nacimiento”, “Fecha de defunción”, etc.
Palabra clave: Capacidad para buscar una palabra específica, a menudo en varios campos de
datos. Además, uso de palabras importantes o “claves” en una búsqueda en la cual las palabras
secundarias o “no significativas” no se buscan.
Limitación: Requiere que los resultados de la búsqueda estén dentro de un intervalo específico,
tales como el campo de fecha en el catálogo de una biblioteca.
Anidamiento (agrupación): En las búsquedas booleanas, requiere que algunas combinaciones
(búsqueda anidada) se realicen antes que otras.
Fonético: Búsqueda de palabras (especialmente apellidos) con pronunciación similar, pero
diferente grafía. Existen varios sistemas de indexación diferentes. Dos de los más comunes son
Soundex y Metaphone.
Frase: Búsquedas de dos o más palabras en una secuencia específica. Por lo general, las palabras
se ingresan entre “comillas”
Proximidad: Los términos de búsqueda deben encontrarse cerca uno del otro en el conjunto de
datos. Por lo general la distancia se puede configurar a modo de un número específico de
caracteres o palabras.
Búsqueda de cadena: Búsqueda de cualquier número de caracteres consecutivos
Encabezamientos de tema: En catálogos de biblioteca, se usan palabras específicamente
seleccionadas para categorizar varios temas relacionados. Por ejemplo, podría utilizarse
“impuestos” para listas de gravámenes, renta feudal, valoración, ingresos por impuestos de
propiedad, etc.
Texto: Conjunto de datos que consta principalmente de texto solamente electrónico. La
información no se segrega en campos específicos. También se le llama “texto libre”.
Truncamiento: Búsquedas con solamente las primeras letras (por lo general tres a cinco o más)
de una palabra para recuperar todas las palabras que comiencen con esas letras.
Comodín: Uso de un símbolo para representar una o más letras en una búsqueda. Los símbolos
habituales incluyen ‘?’ donde cualquier letra puede variar y ‘*’ para representar una o más letras.
Descargar