WebLesp: Corpus de comunicación digital especializada en español

WebLesp es un corpus electrónico que reúne textos representativos de la comunicación digital especializada en español.

El corpus consta de cuatro secciones correspondientes a cuatro macro-ámbitos de conocimiento especializado (ciencias medioambientales, derecho, economía, medicina). Cada sección incluye un subcorpus de textos divulgativos dirigidos a un público lego y otro de géneros especializados propios de la comunicación experto-experto. Lo que todos los textos tienen en común es su naturaleza digital, ya que todos representan géneros publicados y "consumidos" en la web.

ARQUITECTURA

La arquitectura del corpus es la siguiente:

  • Tema: Cambio climático
  • Subcorpus divulgativo: [Ciencia DIV]
    • Blogs divulgativos
    • Informes
    • Sitios web
    Dimensión: 859.506 tokens
  • Subcorpus especializado: [Ciencia ESP]
    • Artículos científicos
    • Informes
    • Tesis doctorales
    Dimensión: 657.752 tokens

  • Tema: Divorcio en España
  • Subcorpus divulgativo: [Derecho DIV]
    • Blogs divulgativos
    • Artículos en prensa generalista
    • Sitios web
    Dimensión: 759.598 tokens
  • Subcorpus especializado: [Derecho ESP]
    • Textos normativos (artículos del Código Civil español + leyes)
    • Textos interpretativos (artículos académicos, tesis doctorales)
    • Textos aplicativos (sentencias)
    Dimensión: 761.528 tokens

  • Tema: Economía española vs. economía UE
  • Subcorpus divulgativo: [Economía DIV]
    • Blogs divulgativos
    • Artículos en prensa generalista
    Dimensión: 752.781 tokens
  • Subcorpus especializado: Economía ESP]
    • Informes
    • Artículos académicos
    Dimensión: 852.409 tokens

  • Tema: Cáncer de mama
  • Subcorpus divulgativo: [Medicina DIV]
    • Artículos en prensa generalista
    • Artículos en prensa especializada
    • Sitios web
    Dimensión: 908.853 tokens
  • Subcorpus especializado: [Medicina ESP]
    • Resumen
    • Artículos científicos
    • Blogs especializados
    • Guías clínicas
    • Tesis doctorales
    Dimensión: 925.460 tokens
HISTORIA

La creación del corpus WebLesp ha sido financiada por la Universidad “G. D’Annunzio” de Chieti-Pescara (Fondi FARS) y es el fruto de la colaboración entre el Dipartimento di Lingue, Letterature e Culture Moderne de la Universidad "G. D’Annunzio" de Chieti-Pescara (Prof.ssa Sara Piccioni) y el Dipartimento di Scienze Giuridiche, del Linguaggio, dell'Interpretazione e della Traduzione (IUSLIT) de la Universidad de Trieste (Prof. Gianluca Pontrandolfo).

REFERENCIA

Si usas WebLesp en tu investigación, puedes citarlo y referenciarlo así:

Piccioni, S. & Pontrandolfo, G. (2021). "Weblesp: corpus de comunicación digital especializada en español. Arquitectura, compilación y usos". Revista de Lingüística Teórica y Aplicada (RLA) 59(1): XXX-XXX.

Scopri cosa vuol dire essere dell'Ud'A

SEDE DI CHIETI
Via dei Vestini,31
Centralino 0871.3551

SEDE DI PESCARA
Viale Pindaro,42
Centralino 085.45371

email: info@unich.it
PEC: ateneo@pec.unich.it
Partita IVA 01335970693

icona Facebook   icona Twitter

icona Youtube   icona Instagram