Tácticas para la búsqueda eficaz en bases de datos Kory L. Meyerink, MLS, GENEALOGISTA ACREDITADO, FUGA Salt Lake City, Utah Correo electrónico: [email protected] En línea o sin conexión, la investigación genealógica moderna requiere de la búsqueda eficaz en bases de datos. Con millones de nombres en cientos de diferentes bases de datos, es fácil que se pierda un antepasado. El éxito de su investigación depende de que sepan la mejor manera de buscar en cada colección. Los conceptos operador booleano, truncamiento, palabra clave, datos de campo, proximidad, frase y comodín no son términos ajenos, sino más bien sus claves para el éxito con la genealogía BOSQUEJO DE ANÁLISIS Tipos de bases de datos De campo Texto Métodos o sintaxis de búsqueda Palabra clave Fonético (Soundex, Metaphone) Caracteres comodín Truncamiento Frase Operador booleano Búsqueda de campo Limitación Proximidad Búsqueda de cadena Vocabulario controlado o encabezamientos de temas Anidamiento (agrupación) Técnicas de búsqueda Menos es más Elijan los campos correctos Opciones de búsqueda avanzada Términos alternativos Experimenten Catálogos de biblioteca Datos de campo Vocabulario controlado Versiones alternativas de bases de datos Ejemplos de operadores booleanos y búsquedas relacionadas Tipos de búsqueda contienen Ejemplo de búsqueda Una palabra (palabra clave) keokuk AND (a menudo automático) snow familia O (puede ser |) nacimiento OR matrimonio Encuentra resultados que “keokuk” tanto “snow” como “familia” “nacimiento” o “matrimonio” NOT (-) chamberlain -neville “chamberlain” pero no “neville” Búsqueda de frase “ciudad de nueva york” la frase: “ciudad de nueva york” Sinónimos (palabras similares) ~genealogía “árbol familiar” “historia familiar” “apellido” Stemming (variaciones de palabras) plasket plasket y plaskett Búsqueda forzada con palabra no significativa +es +para “es” “para” Truncamiento casa “casar” “casarse” “casado” Caracteres comodín: uno Sm?th Smith, Smyth Caracteres comodín: varios pobla* población, poblado, poblacho Proximidad (cercano/adyacente) ellis york@5 “ellis” y “york” a una distancia de 5 palabras Soundex (fonético) chamberlain chamberlin, chambers, etc. Dónde encontrar otras versiones de algunas bases de datos Sitios de base de datos genealógicas principales Sitios estatales (especialmente para registros esenciales) Páginas GenWeb de condados Sitios de registros específicos (como de cementerios o listas de pasajeros) Algunas colecciones “académicas” Bibliografía de referencias de búsqueda Calishain, Tara. Web Search Garage. Upper Saddle River, NJ: Prentice Hall, 2005. Crume, Rick. “Top 10 Public Libraries”, FamilyTreeMagazine.com 10/8/2010. Hill, Brad. Google for Dummies. New York: Wiley Pub., 2003. 360 págs. Lynch, Daniel M. Google Your Family Tree. Provo: FamilyLink.com, 2008. 340 págs. Mann, Thomas. The Oxford Guide to Library Research, 3ra edición, Nueva York: Oxford, 2005. ProQuest Database Guide: Heritage Quest Online (En línea: ProQuest, 2010), <http://www.proquest.com/assets/downloads/products/hqo_db_guide.pdf> consultado en noviembre de 2013. Research Buzz revista electrónica diaria por Tara Calishain <http://www.researchbuzz.com> [email protected] Comparación de funciones de búsqueda de bases de datos Nota: Algunas bases de datos tienen distintos parámetros de búsqueda. [# indica cualquier número] Proveedor/Base Fonético de datos Operador booleano Trunca- Comomiento dín Frase Proximidad Búsqueda de campo Ancestry Soundex No * después * de 3 No No Sí Textos de archivo de internet Aproximació AND, OR, n~ NOT * * “comillas” No Búsqueda avanzada “comillas” No Sí Heritage Quest: No PERSI and, or, not * No Google No AND, OR, NOT Stem palabra “comillas” No en frase No GNIS No auto and * * “comillas” No Sí Bowker / Libros and, or, Desconocido impresos andnot * No No Búsqueda avanzada Chadwyck Healey Desconocido and, or, not * ? pre determinad cerca. # o Usar cuadros de entrada de campo. RootsWeb Soundex Metaphone No * * “comillas” No Sí Fold3 No AND, OR, NOT * * “comillas” No Búsqueda avanzada World Bio. Info. No Systems AND, OR, NOT * * “comillas” No Búsqueda biográfica Newspaper Archive Sí, por campo No No Sí, campo No Sí Genealogy Bank No and, or, not * ? “comillas” cerca# Nombre y fecha The Genealogist Sí No * No No Sí Encyclopedia Britannica No No * No Búsqueda avanzada no está disponible Origins Network NameX No * *, ? No No Ordenar columnas WorldCat No and, or, not +, |, - *o? después de 3 #, ? “comillas” n# Búsqueda avanzada GaleNet No and, or, not * ? “comillas” n# Búsqueda personalizada JSTOR No and, or, andnot + para -s o es No Sí Usar menús desplegables No No No cerca Diccionario No Oxford en inglés and, or, y not * ? pre cerca, determinad antes, o después Usar menús desplegables. Definiciones Operador booleano: Método de búsqueda con uno o más términos en combinación o en exclusión mutua y con palabras de conexión (llamadas ‘operadores’) que definen la relación que existe entre las dos palabras. Las palabras de conexión suelen ser: AND, OR, NOT. Lleva el nombre de George Boole. Vocabulario controlado: Se asignan diferentes palabras con significados similares o relacionados a una palabra específica. Las búsquedas con esa palabra devolverán cualquiera de las palabras asignadas. Ejemplo: Baviera, Prusia y Hessen se asignan a Alemania en las búsquedas de censo de Estados Unidos de Ancestry.com. Búsqueda de campo: Las solicitudes de búsqueda se hacen en campos determinados de forma específica y sólo se encuentran concordancias en ese campo. Datos de campo: Toda la información de una base de datos se ingresa en campos específicos, tales como “Nombre”, “Lugar de nacimiento”, “Fecha de defunción”, etc. Palabra clave: Capacidad para buscar una palabra específica, a menudo en varios campos de datos. Además, uso de palabras importantes o “claves” en una búsqueda en la cual las palabras secundarias o “no significativas” no se buscan. Limitación: Requiere que los resultados de la búsqueda estén dentro de un intervalo específico, tales como el campo de fecha en el catálogo de una biblioteca. Anidamiento (agrupación): En las búsquedas booleanas, requiere que algunas combinaciones (búsqueda anidada) se realicen antes que otras. Fonético: Búsqueda de palabras (especialmente apellidos) con pronunciación similar, pero diferente grafía. Existen varios sistemas de indexación diferentes. Dos de los más comunes son Soundex y Metaphone. Frase: Búsquedas de dos o más palabras en una secuencia específica. Por lo general, las palabras se ingresan entre “comillas” Proximidad: Los términos de búsqueda deben encontrarse cerca uno del otro en el conjunto de datos. Por lo general la distancia se puede configurar a modo de un número específico de caracteres o palabras. Búsqueda de cadena: Búsqueda de cualquier número de caracteres consecutivos Encabezamientos de tema: En catálogos de biblioteca, se usan palabras específicamente seleccionadas para categorizar varios temas relacionados. Por ejemplo, podría utilizarse “impuestos” para listas de gravámenes, renta feudal, valoración, ingresos por impuestos de propiedad, etc. Texto: Conjunto de datos que consta principalmente de texto solamente electrónico. La información no se segrega en campos específicos. También se le llama “texto libre”. Truncamiento: Búsquedas con solamente las primeras letras (por lo general tres a cinco o más) de una palabra para recuperar todas las palabras que comiencen con esas letras. Comodín: Uso de un símbolo para representar una o más letras en una búsqueda. Los símbolos habituales incluyen ‘?’ donde cualquier letra puede variar y ‘*’ para representar una o más letras.