Vocabulario más frecuente - Universidad Autónoma de Madrid

Anuncio
Corpus de español como lengua extranjera
Vocabulario más frecuente
Vocabulario más frecuente
Se presentan las listas de vocablos más frecuentes (lematizados) en nuestro corpus por
cada categoría léxica (sustantivos, verbos, adverbios y adjetivos), en dos rangos: más de
50 ocurrencias (inclusive), y entre 50 y 20. Se ofrece el lema, la frecuencia absoluta y
relativa, y su distribución en el total de participantes. La frecuencia relativa se calcula a
partir del número total de ocurrencias de la categoría correspondiente; p. ej., el lema
PAELLA presenta una frecuencia de 131 en relación a todos los sustantivos usados
(8020), lo que equivale a una frecuencia relativa (en %) de 131/8020 x 100 = 1,633%.
La distribución se presenta en porcentaje sobre el total de participantes (N = 40): esto
es, la distribución del 80% significa que el lexema se usa en 32 entrevistas.
1. Lemas con más de 50 occurrencias:
Verbos
SER
ESTAR
COMER
HABER
TENER
GUSTAR
CREER
IR
HACER
SABER
DECIR
HABLAR
QUERER
ESTUDIAR
LLAMARSE
Frec.
1713
444
427
385
373
297
293
293
270
266
244
227
206
149
126
F. rel.
19,499%
5,054%
4,861%
4,382%
4,246%
3,381%
3,335%
3,335%
3,073%
3,028%
2,777%
2,584%
2,345%
1,696%
1,434%
Dist.
100,0%
100,0%
100,0%
92,5%
100,0%
100,0%
87,5%
100,0%
95,0%
97,5%
90,0%
95,0%
90,0%
97,5%
100,0%
Verbos
COCINAR
PARECER
PEDIR
VER
PONER
VIVIR
APRENDER
ENTENDER
CONOCER
PENSAR
PREGUNTAR
CERRAR
COMPRAR
PODER
Frec.
114
102
101
90
83
80
77
73
66
66
56
55
51
50
F. rel.
1,298%
1,161%
1,150%
1,024%
0,945%
0,911%
0,876%
0,831%
0,751%
0,751%
0,637%
0,626%
0,581%
0,569%
Dist.
77,5%
72,5%
65,0%
85,0%
62,5%
72,5%
70,0%
62,5%
62,5%
57,5%
60,0%
87,5%
52,5%
52,5%
Sustantivos
ESPAÑOL
COMIDA
CAMARERO
HAMBURGUESA
COSA
RESTAURANTE
PAELLA
CARNE
AÑO
HOMBRE
PATATA
POLLO
GENTE
VEZ
VINO
INGLÉS
AMIGO
PLATO
Adverbios
SÍ
NO
MUY
AQUÍ
TAMBIÉN
MÁS
BIEN
DESPUÉS
SOLO
JA
Frec.
3371
1927
630
305
261
258
169
157
151
117
Frec.
229
175
159
152
150
141
131
124
122
116
109
106
100
100
100
99
95
94
F. rel.
2,855%
2,182%
1,983%
1,895%
1,870%
1,758%
1,633%
1,546%
1,521%
1,446%
1,359%
1,322%
1,247%
1,247%
1,247%
1,234%
1,185%
1,172%
F. rel.
38,194%
21,833%
7,138%
3,456%
2,957%
2,923%
1,915%
1,779%
1,711%
1,326%
Leonardo Campillos Llanos
Dist.
100,0%
95,0%
97,5%
90,0%
82,5%
97,5%
100,0%
97,5%
95,0%
77,5%
87,5%
95,0%
85,0%
80,0%
97,5%
97,5%
80,0%
70,0%
Dist.
100,0%
100,0%
100,0%
95,0%
92,5%
95,0%
87,5%
77,5%
75,0%
10,0%
Sustantivos
CUENTA
ARROZ
PIZZERÍA
TIEMPO
CHICO
QUESO
VERDURA
PAN
CEBOLLA
DÍA
PERSONA
CIUDAD
PIMIENTO
TOMATE
CASA
MES
MARISCO
SALSA
Adverbios
AHORA
COMO
SIEMPRE
ASÍ
ANTES
YA
A VECES
LUEGO
NORMALMENTE
Frec.
90
89
85
81
76
76
73
72
68
66
65
64
63
63
60
51
50
50
Frec.
102
97
80
78
61
58
52
52
51
F. rel.
1,122%
1,110%
1,060%
1,010%
0,948%
0,948%
0,910%
0,898%
0,848%
0,823%
0,810%
0,798%
0,786%
0,786%
0,748%
0,636%
0,623%
0,623%
Dist.
100,0%
100,0%
87,5%
87,5%
62,5%
95,0%
70,0%
75,0%
87,5%
65,0%
52,5%
55,0%
82,5%
95,0%
67,5%
65,0%
65,0%
55,0%
F. rel.
1,156%
1,099%
0,906%
0,884%
0,691%
0,657%
0,589%
0,589%
0,578%
Dist.
77,5%
62,5%
72,5%
40,0%
75,0%
50,0%
52,5%
45,0%
47,5%
Universidad Autónoma de Madrid
Corpus de español como lengua extranjera
Adjetivos
BUENO
FRITO
MÁS1
TÍPICO
Frec.
100
75
73
70
F. rel.
4,760%
3,570%
3,475%
3,332%
Vocabulario más frecuente
Distribución
77,5%
90,0%
65,0%
67,5%
Adjetivos
DIFÍCIL
ESPAÑOL
TINTO
DIFERENTE
Frec.
63
56
54
51
F. rel.
2,999%
2,665%
2,570%
2,427%
Distribución
67,5%
60,0%
90,0%
52,5%
2. Lemas entre 50 y 20 ocurrencias:
Verbos
VENIR
PASAR
PREFERIR
ENCONTRAR
BUSCAR
ENCANTAR
SALIR
PREPARAR
DEPENDER
CENAR
LLEGAR
TOMAR
USAR
LEER
UNKN2
Frec.
47
45
44
39
37
37
37
36
33
32
31
31
31
28
28
Sustantivos
MEJILLÓN
MESA
PISO
SITIO
UNIVERSIDAD
PAÍS
BOCADILLO
GAMBA
HORA
LENGUA
UNKN
GUISANTE
PASTA
HAMBURGUESERÍA
LECHUGA
PALABRA
TIPO
IDIOMA
LIMÓN
SEMANA
ACEITE
CINE
SOPA
Adjetivos
RICO
PEQUEÑO
MEJOR
FÁCIL
RARO
ROJO
MISMO
GRANDE
Frec.
44
43
43
36
32
32
31
29
F. rel.
0,535%
0,512%
0,501%
0,444%
0,421%
0,421%
0,421%
0,410%
0,376%
0,364%
0,353%
0,353%
0,353%
0,319%
0,319%
Frec.
48
48
47
47
46
45
44
44
41
41
41
39
38
37
36
36
36
35
35
35
34
34
34
F. rel.
2,094%
2,047%
2,047%
1,713%
1,523%
1,523%
1,475%
1,380%
Dist.
55,0%
50,0%
57,5%
50,0%
47,5%
32,5%
62,5%
40,0%
45,0%
40,0%
47,5%
40,0%
35,0%
40,0%
37,5%
F. rel.
0,599%
0,599%
0,586%
0,586%
0,574%
0,561%
0,549%
0,549%
0,511%
0,511%
0,511%
0,486%
0,474%
0,461%
0,449%
0,449%
0,449%
0,436%
0,436%
0,436%
0,424%
0,424%
0,424%
Distribución
45,0%
47,5%
50,0%
55,0%
45,0%
55,0%
47,5%
52,5%
Verbos
VIAJAR
INTENTAR
LLEVAR
ELEGIR
EMPEZAR
TRABAJAR
DAR
ACONSEJAR
BEBER
NECESITAR
QUEDARSE
CAMBIAR
UTILIZAR
DECIDIR
Dist.
82,5%
70,0%
47,5%
57,5%
65,0%
60,0%
60,0%
85,0%
45,0%
52,5%
47,5%
62,5%
37,5%
50,0%
72,5%
55,0%
42,5%
50,0%
80,0%
40,0%
42,5%
40,0%
27,5%
Frec.
28
27
27
26
26
26
24
23
23
23
22
21
21
20
Sustantivos
COMPAÑERO
AGUA
CLASE
TRABAJO
ESCUELA
FRANCÉS
CLIENTE
CONSEJO
CURSO
ESTUDIANTE
PADRE
HUEVO
LUGAR
PEPINO
CENTRO
ENSALADA
HISTORIA
PROBLEMA
SAL
NOCHE
PIZZA
PORTUGUÉS
DIBUJO
Adjetivos
RÁPIDO
IMPORTANTE
BARATO
MALO
MEDIO
SANO
ÚLTIMO
VERDE
Frec.
28
27
24
24
24
24
24
20
F. rel.
0,319%
0,307%
0,307%
0,296%
0,296%
0,296%
0,273%
0,262%
0,262%
0,262%
0,250%
0,239%
0,239%
0,228%
Frec.
33
30
30
30
29
29
26
26
26
26
26
25
25
25
24
24
23
23
23
22
22
21
20
F. rel.
0,411%
0,374%
0,374%
0,374%
0,362%
0,362%
0,324%
0,324%
0,324%
0,324%
0,324%
0,312%
0,312%
0,312%
0,299%
0,299%
0,287%
0,287%
0,287%
0,274%
0,274%
0,262%
0,249%
F. rel.
1,333%
1,285%
1,142%
1,142%
1,142%
1,142%
1,142%
0,952%
Dist.
30,0%
30,0%
35,0%
35,0%
40,0%
30,0%
35,0%
35,0%
35,0%
32,5%
25,0%
30,0%
20,0%
25,0%
Dist.
47,5%
42,5%
42,5%
45,0%
37,5%
35,0%
30,0%
45,0%
45,0%
47,5%
35,0%
32,5%
35,0%
47,5%
37,5%
30,0%
27,5%
27,5%
32,5%
35,0%
30,0%
12,5%
20,0%
Distribución
55,0%
32,5%
30,0%
27,5%
35,0%
35,0%
30,0%
35,0%
1
2
MÁS se considera adjetivo ante un nombre (ej. más gente) (Diccionario panhispánico, RAE, 2006).
El lema UNKN se reserva para formas inexistentes (ej. *cabarero) o incomprensibles (transcritas xxx).
Leonardo Campillos Llanos
Universidad Autónoma de Madrid
Corpus de español como lengua extranjera
Adverbios
NUNCA
AL FINAL
CERCA
CASI
AHÍ
MÁS O MENOS
Frec.
44
43
42
40
33
32
F. rel.
0,499%
0,487%
0,476%
0,453%
0,374%
0,363%
Vocabulario más frecuente
Dist.
47,5%
52,5%
60,0%
37,5%
37,5%
47,5%
Adverbios
QUIZÁS
HOY
SOLAMENTE
TAMPOCO
ADEMÁS
MAL
Frec.
28
24
22
22
20
20
F. rel.
0,317%
0,272%
0,249%
0,249%
0,227%
0,227%
Dist.
27,5%
32,5%
25,0%
37,5%
20,0%
35,0%
Leonardo Campillos Llanos
Universidad Autónoma de Madrid
Descargar