Guía sobre análisis de texto

Published:

Ideas clave

  • Texto plano: un archivo de texto simple sin formato (por ejemplo .txt) que es leíble por el computador.
  • Voyant Tools: herramienta de lectura de textos en línea y un ambiente para el análisis de textos digitales.

Paso a paso

  1. Descarga uno o más de los documentos disponibles en texto plano en la sección Acceso a los documentos
  2. Entra a voyant-tools.org, haz clic en “Cargar”
  3. Carga el archivo .txt que descargaste.
  4. Si quieres cargar varios archivos a la vez, comprime los documentos seleccionándolos en la carpeta donde se encuentran, haz clic derecho en la carpeta donde se encuentran los documentos y elige “Compress/” (para Mac) o “Add to archive” (para Windows). En Voyant Tools puedes cargar la carpeta completa.
  5. Una vez cargados tus documentos lo primero que hay que hacer es crear un enlace permanente para tu corpus. Haz clic en el ícono de “Export a URL” (ver imagen abajo) y haz clic en export. Tu corpus seguirá siendo accesible mientras lo abras por lo menos una vez al mes. Asegúrate de crear un “Bookmark” en tu navegador guardando así el enlace de tu corpus.
  6. Los resultados iniciales seguramente no se verán muy interesantes. Dirá que las palabras más comunes son “más”, “ni”, o “a”. Necesitas filtrar estas palabras con la utilidad de “stopwords”. Haz clic en el botón “Define options for this tool” (ver imagen abajo) y al lado del campo “Stopword-Auto-detect” haz clic en “Editar lista”. Añade las palabras necesarias (las que no quieres que te muestre la nube de palabras), salvar y dale clic a “Confirmar”. El corpus se debe poder visualizar mejor ahora.
  7. Examina tu nube de palabras y revisa la sección “Summary” donde podrás ver la lista de palabras distintivas.
  8. Algunas preguntas para reflexionar y utilizar esta metodología en el salón de clases o para tus propias investigaciones:
    • ¿Cuáles son las palabras más comunes en los documentos históricos?
    • Al revisar la lista de “palabras diferenciadas”, ¿podrías organizar bajo una etiqueta común algunas “palabras distintivas”?
    • En la sección “Palabras claves en contexto” puedes seleccionar palabras dentro del corpus (e.g. Conquista) y y ver el texto circundante dentro del mismo. ¿Qué podríamos decir de la manera en que los autores de los textos hablan sobre la conquista o sobre los indios?
  9. Para tener en cuenta. Voyant tools tiene muchas más opciones. Consulta la documentación para resolver dudas y aprender más sobre su funcionalidad.
  10. Esta lección en español sobre Voyant Tools te será de utilidad para explorar a mayor profundidad las potencialidades de la herramienta.